基于网络视频业务的搜索引擎的设计与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:ruindown
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet和Web技术的飞速发展,WWW已经成为人们进行信息交流不可缺少的巨大信息空间。面对如此大量的信息,人们在寻找自己所需要的信息时常常迷失方向。如何快速、准确的从浩瀚的信息资源中找到自己所需要的信息已经成为困扰用户的一大难题。随着搜索引擎的广泛应用,人们对于搜索引擎的要求也越来越高,查准率和查全率成为衡量搜索引擎的重要标志,无用信息过滤也成为人们开始关注的问题。另外,通用搜索引擎已经不能满足人们对于特定领域的检索要求,多元化的搜索引擎开始应运而生,专业性和专题性的搜索引擎层出不穷。另外,随着现在网络的普及,网络已经慢慢融入人们的生活和娱乐。网络视频具有可以在线观看、不需要下载、短小精悍、内容丰富等特点,因此受到越来越多网络用户的欢迎。目前,用户要想在传统的通用搜索引擎上搜索某一个特定的网络视频,其返回结果往往是很多无用的网页信息,因此,针对通用搜索引擎的不足,本课题结合搜索引擎的原理和网络视频的特点,开发了基于网络视频业务的搜索引擎,用来解决用户在搜索网络视频方面的问题。本文研究并实现了基于网络视频业务的搜索引擎系统。实现该系统时,引入了搜索引擎的架构模型,即网络蜘蛛、索引器和检索器,并且加入了分词和搜索自动提示功能。该搜索引擎系统主要基于全文检索引擎Apache Lucene构建,本文详细论述了该搜索引擎所需要的相关理论,并给出了系统的整体框架结构图以及各个部分的详细设计方案,最后给出了该系统的运行效果。
其他文献
数字水印技术是知识产权保护和安全隐秘通信的重要手段之一。视频水印是数字水印技术的重要分支,具有不同于其他载体类型水印的特点。由于数字视频在多媒体产品中占有较大的
本论文对入侵检测研究现状进行了总结,对入侵检测的主要技术、方法、体系结构进行了深入的分析,提出了入侵检测技术面临的问题和研究发展趋势,并对入侵检测技术的主要技术难
数据流自然地出现于很多监控应用中,如网络和金融服务,而这些数据流应用限制了标准关系数据库技术的适用性。许多数据流源在量上是倾向于爆发性的,而CPU处理能力不足和内存有
在现实生活中,数据发布者,如Facebook,往往会将社会网络发布出来。通过数据挖掘等技术手段,研究人员能够发掘隐藏于其中的价值规律。与此同时,社会网络所包含的用户隐私信息
近年来P2P研究升温,而资源定位是P2P网络研究中的热点问题。目前,最受研究者们关注的是基于DHT(分布式哈希表)的结构化定位模型。DHT路由算法使用分布式哈希函数进行资源定位,快
在许多实际工程和科学研究中,混沌现象已经成为普遍存在,因而对混沌的研究显得越来越重要。本文采用理论推导和数值模拟相结合的方法对混沌系统的同步方法做了研究,取得了如下成
存储网格是网格技术发展的一个重要组成部分。它将分布在网络中的计算机集合起来,充分利用各个计算机的计算资源以整合出一个强大的计算系统一样,它将网络中的存储系统进行了整
随着数据库技术的飞速发展以及人们获取数据手段的多样化,人类所拥有的数据急剧增加,如何从规模越来越大的数据库中提取出人们感兴趣的信息以及知识,即数据挖掘技术早已成为
随着数据中心技术的不断发展,以及数据中心应用的不断产生,不同数据中心应用对网络提出了不同的性能要求。这导致了许多新的数据中心技术不断被提出。Web应用作为数据中心中
移动设备的飞速发展在给人们的生活带来便捷的同时也大大增加了个人隐私泄露的风险,移动设备的数据存储、信息通信的安全性问题受到人们越来越多的关注。P2P技术是无线网络环