【摘 要】
:
本文对文本相似度计算的各个层次进行了论述,在词语相似度计算的基础上重点研究了中文信息处理中的句子相似度计算。首先,比较了词语相似度计算的不同方法,实现了目前效果较
论文部分内容阅读
本文对文本相似度计算的各个层次进行了论述,在词语相似度计算的基础上重点研究了中文信息处理中的句子相似度计算。首先,比较了词语相似度计算的不同方法,实现了目前效果较好的基于《知网》的词语相似度计算方法;其次,在词语相似度计算的基础上,针对目前句子相似度计算方法的种种不足,提出了基于相似词对计算模句子相似度计算方法。最后,结合自动问答系统,给出了句子相似度计算方法的应用实例,并通过FAQ库中的相似问句匹配实验,证明了本文所提出方法的有效性。具体来讲:本文在句子相似度计算的研究过程中,所做的主要工作及取得的主要成果如下:(一)比较分析了词语相似度计算的各种方法,实现了目前效果较好的基于《知网》的词语相似度计算方法,为下一步句子相似度的计算打下基础。(二)提出了一种在词语相似度的基础上,基于相似词对计算模型的句子相似度计算方法。由于目前句子语法结构分析的困难,利用句子中出现的词语的相似性来计算句子的相似性,是句子相似度计算的一个较好的思路。句子中出现的词汇之间有着各种各样的语法、语义联系,对于相似度计算,相似词对的共现是有着激励效应的。我们首先给出了相似词对共现影响的计算公式,在此基础上,提出了句子之间相似度的计算方法。(三)结合自动问答系统,给出了句子相似度计算的应用实例。本文把句子的相似度计算用于自动问答系统中FAQ库的相似问句匹配,演示了相似度计算在具体应用中的实现过程和操作步骤。并通过问句匹配实验证明了文本所提出的句子相似度计算方法的实用性和有效性。
其他文献
目的探讨银杏叶提取物对原发性肾病综合征(NS)患儿高脂血症的治疗效果。方法将我科2000年10月~2005年10月收治的35例小儿NS随机分为两组:治疗组(银杏叶)18例,采用强的松加银杏
本文赏析了《梦游天姥吟留别》的独特格调。从诗人的怀才不遇的愤懑到瑰丽奇特的“天马行空”式的构思,从诗人丰富想象,大胆夸张的浪漫主义气质到诗人蔑视权贵的傲岸性格,从
现如今你觉得最贴心的服务是什么?网购达人们说:最贴心的是马云。一个淘宝,从吃穿住行到生活缴费应有尽有;长年出门的人说:最贴心的是携程、“去哪儿”这样的APP,从订票到住
<正> 帝国主义列强争夺中国东北地区的矛盾和冲突,1905年后逐渐呈现出新的趋势。最显著的特点是日俄修好与日美交恶,即昔日兵戎相见的寇仇日俄两国在远东携手各作,而美国却由
在现代社会中我们的大部分时间都是在室内度过的,因此,居住环境的创造,应该把安全和有利于人们的身心健康和使用方便作为室内设计的首要前提,人们对于室内环境除了有睡眠,休
通过对"六统一"母线保护装置有关逻辑功能技术的研究,结合辽宁电网实际运行情况,详细分析了应用过程中与相关保护回路配合方面存在的问题,并提出了有针对性的解决措施。通过
儒家学派在先秦诸子百家中是积极出仕的代表。自孔子以来的儒家学派思想家大多宣扬出仕思想,鼓励士人积极出仕。孟子是其中极具代表性的一位,孟子十分肯定孔子对于出仕的态度
高级量测体系增值服务是建设智能用电的重要内容。分析了电力企业和用户对开展增值服务业务的应用需求,提出了用电服务网络信息查询、用电辅助决策、智能家居自动控制、自助
人性问题是贯穿孟子和荀子思想的根本问题,也是贯穿中国儒学发展的根本问题,厘清孟、荀二人在人性问题上的差异与融通,对于整体把握孟子和荀子思想具有关键意义。孟、荀二人
创业风险投资引导基金,是指由政府出资、以股权或债权等方式投资于创业风险投资机构以支持创业企业发展的专项资金。设立创业风险投资引导基金,可以有效地提高政府资金效率,