一种编辑距离算法及其在网页搜索中的应用

来源 :西安交通大学学报 | 被引量 : 25次 | 上传用户:foreststonezgdd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统方法不能很好地处理网页中简短域与用户查询之间的相关性排序问题,提出一种基于改进的编辑距离排序算法.将以词为单位的用户查询和简短网页域通过匹配编码转化为2个字符串,再利用改进的编辑距离计算2个字符串之间的相似性.由于在用户查询与待比较的简短网页域之间引入了查询词分布的位置、顺序和距离等,以及含有查询词修饰关系的重要信息,所以编码字符串之间的相似程度可以衡量对应的查询与简短网页域之间的相关性.经大规模真实搜索引擎实验表明,该算法较之传统的相关性排序算法,可以显著地提高网页搜索中的简短网页域相关性
其他文献
针对贝尔实验室垂直分层空时系统最大似然检测复杂度过高的问题,提出一种简化最大似然算法.该算法利用多维高斯分布逼近干扰加噪声的统计特性,并根据发射天线数和调制阶数来
如何进行农业种植业结构调整,增加农民收入,是摆在广大农技人员面前的课题,根据晋城市范围内的地理环境和气候特点,结合番茄的生长特性,近年来在全市范围内试验、示范了旱地麦茬复
根据黑龙江省植被破环、黑土流失严重的实际情况,结合对国内外保护性耕作技术的了解和认识,阐述了适合我国国情的各类保护性耕作技术模式,分析了发展保护性耕作的自然条件和社会
为了确保2008年农村沼气工程在年底圆满完成,运城市农业局环保站于2008年10月27日组织召了由全市13县(市,区)环保站长参加的沼气建设促进会,会议由运城市农业局环保站站长石建军主