【摘 要】
:
相似度计算是自然语言处理工作的基石。随着自然语言处理技术的发展,相似度计算的研究价值和应用价值突显。现有的计算方法因其复杂度和精确度的问题,与现实应用的需求并不匹
【基金项目】
:
国家自然科学基金项目(61772081).
论文部分内容阅读
相似度计算是自然语言处理工作的基石。随着自然语言处理技术的发展,相似度计算的研究价值和应用价值突显。现有的计算方法因其复杂度和精确度的问题,与现实应用的需求并不匹配。针对现有需求,对于不同粒度的文本,研究出一套适合大规模实际应用的相似度计算方法体系迫在眉睫。从方法论的角度,对目前主流的相似度计算方法进行总结,介绍了不同粒度的文本相似度计算的差别以及近几年的研究进展,总结了目前相似度计算方向存在的问题,并对发展趋势进行了展望。
其他文献
国家发展和改革委员会价格司司长曹长庆7月25日在发改委举办的2007年上半年经济运行新闻发布会上说,今年下半年价格总体水平将在一种相对稳定的态势中缓慢上涨,下半年的秋粮收
风电机组齿轮箱故障发展进程中早期劣化特征信息微弱,采用传统的奇异值分解(Singular Value Decomposition,SVD)降噪方法容易造成有用信息的丢失。针对这一问题提出基于μ-SVD
本文结合实践,对各类中小型自由锻锻件坯料尺寸的确定方法进行了探讨。
针对目前基于语义角色的实体及关系抽取技术效果不理想以及存在无法正确提取多个宾语的缺陷,提出一种基于语义角色和依存关系融合的方法:1)通过语义角色标注的方式抽取主语和
为实现光纤光栅的高速精确解调,设计了3 d B带宽在1~3 nm之间的宽带布拉格光栅,进行波长寻峰分析,并进行了实验验证。实验结果表明,使用CCD检测光栅反射光谱信号时,像素点间波
针对虚拟同步发电机控制算法在新能源并网中具有稳定系统运行的积极作用,提出了采用传统功率下垂控制算法取代虚拟同步发电机算法中的有功/频率调节和无功/电压调节部分,保留
在Archard模型的基础上构建了一种考虑摩擦副接触面积的磨损量计算模型。依据实验结果确定了磨损系数K的函数表达式,讨论了单一工况条件下不同接触比例摩擦片对离合器磨损量
我们通过引入拓扑结构给出命题逻辑紧致性定理的拓扑证明,并给出一阶逻辑紧致性定理在拓扑空间中的等价形式。
针对滚动轴承故障成分易被强背景噪声淹没,造成故障特征提取困难的问题,提出了一种采用变分模态分解(variational mode decomposition, VMD)与基于负熵的快速独立成分分析(fast
针对参数回归模型受很多函数假设限制和非参数回归模型受"维数灾难"影响问题,构造出半参数线性回归模型。结合半参数线性回归模型的主成分估计和Liu估计方法,提出了半参数线性