电视节目的个性化搜索研究

被引量 : 0次 | 上传用户:nullg08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电视节目是人们普遍喜欢的娱乐方式之一。然而随着电视技术的高速发展,电视节目日益丰富的,人们不知不觉中已深处在电视节目的海洋中。电视节目包含了文本字幕,因而对电视节目的查找可间接地转换为对电视文本的搜索。为了帮助用户快速地查找到喜爱的电视节目,上海交通大学软件学院数字家电实验室和日立公司共同对电视节目的个性化搜索进行了研究,并开发了一个小型的个性化电视节目搜索原型系统。本文主要研究了基于文本的电视节目的个性化搜索,在文章最后可以看到我们的个性化搜索算法可以显著提高搜索质量。当前搜索引擎已经成为网民最普遍的辅助检索Web信息的工具。对于人们给定的查询,目前的网络搜索引擎返回的检索结果还令人满意,但是现在搜索引擎一个很大的缺陷是不能辨析用户的搜索意图。搜素引擎通常可以返回数以千计的结果,但只有极少数满足用户的需要。究其原因主要是现在通用的搜索引擎仅以用户查询关键字作为惟一的输入;而光凭关键字本身并不能完全代表不同用户的不相同的查询意图。假如系统掌握了用户的个人爱好信息,毫无疑问能够向用户提供更符合兴趣的查询结果。众所周知,每个人对查询结果的是否符合各自的需求的理解是各不相同的;个性化搜索目的是针对相同的查询,向不同的用户提供不同的且更满足其搜索意图的搜索结果。个性化搜索是当今搜索引擎领域热门的研究方向之一。在本文中,我们研究了通过使用用户反馈改进搜索质量、通过用户兴趣模型过滤和重排序搜索结果、通过用户扩展捕捉用户潜在的查询意图等途径来共同实现个性化搜索的方法。用户反馈通过显式或隐式的方式来反映出用户的兴趣爱好;用户兴趣模型通过学习用户反馈获得的反映用户喜好的文档后,被用来重排序初始的查询文档,使之体现个性化的结果;查询扩展是系统通过对用户查询关键字进行扩展,并经过用户兴趣模型的过滤,主动地向用户提供潜在的符合用户查询意图的查询关键字。在本文中,我所进行的研究主要包括:提出了综合了用户反馈、用户兴趣模型和用户查询扩展等方法的基于文本的电视节目个性化搜索系统的架构设计;提出了多兴趣的用户兴趣模型的建立、动态更新算法;提出了利用语义库和使用基于字符串相似的搜索日志IDF过滤等两种用户查询关键字扩展方法;提出了一种高效的变长索引压缩算法。
其他文献
蒸压加气混凝土生产中,钙质材料和硅质材料在原料配比中占绝大部分比例,它们是组成蒸压加气混凝土的基础材料。原材料中CaO和SiO2相对数量的多少会直接对成品中的水化产物结构
本文对激光告警信号接收与处理的方法进行了研究,并对激光告警系统的软硬件设计及工作原理进行了详细的论述。论文主要作了如下几个方面的设计研究:1.根据激光探测的原理,提
本论文通过调查研究长沙植物造景现状,对长沙市的几大公园,如烈士公园、南郊公园、晓园公园等观赏植物造景的调查研究,了解了几大公园绿地种植现状、观赏植物种类和造景类型,
本文运用国际贸易学、贸易经济学、产业经济学、商品经济学原理,在大量收集相关数据、信息资料的基础上,采取定性分析与定量分析相结合、实证分析与规范分析相结合等多种方法
深入探索富源县后所镇的马铃薯种植与田间管理技术,有助于促进当地经济效益提升,优化居民饮食结构,并为农业实践提供重要技术支持.基于此,本文从土地选择、整地、种薯处理、
高超声速飞行器是未来重要的飞行工具,严重的气动热是高超声速飞行器初步设计中需要攻克的关键技术问题之一。采用数值方法预测气动热,可以给出飞行器表面详细的热流密度分布
高空探测是研究大气过程的最基础手段。L波段二次测风雷达和数字探空仪配合完成数据的采集与传输。该文通过从高空探测系统使用过程中遇到的问题入手,归纳了一些问题与解决方
在总结和继承国内外有关离散元法的基本理论、算法和程序设计方面的研究成果及先进经验的基础上,结合相关机械部件的特点和设计要求,本文采用椭圆方程建立了椭圆形颗粒的二维
毛细管离子色谱法因消耗试剂量少、易于与质谱相连等一系列优点成为离子色谱法的一个重要发展方向。在毛细管离子色谱法所用的色谱柱中,整体柱是一种很有优势的色谱柱。其优
为了解决标准的交互式多模型(Interacting Multiple Model, IMM)算法中Markov概率转移矩阵固定不变的问题,结合容积卡尔曼滤波(CubatureKalmanFilter,CKF)算法,提出了一种Markov概率