【摘 要】
:
本文针对基于词向量的词语语义相似度计算方法在多义词、非邻域词和同义词三类情况计算准确性差的问题,提出了一种基于词义向量模型的词语语义相似度算法.与现有词向量模型不
论文部分内容阅读
本文针对基于词向量的词语语义相似度计算方法在多义词、非邻域词和同义词三类情况计算准确性差的问题,提出了一种基于词义向量模型的词语语义相似度算法.与现有词向量模型不同,在词义向量模型中多义词按不同词义被分成多个单义词,每个向量分别与词语的一个词义唯一对应.我们首先借助同义词词林中先验的词义分类信息,对语料库中不同上下文的多义词进行词义消歧;然后基于词义消歧后的文本训练词义向量模型,实现了现有词向量模型无法完成的精确词义表达;最后对两个比较词进行词义分解和同义词扩展,并基于词义向量模型和同义词词林综合计算词语之间的语义相似度.实验结果表明本文算法能够显著提升以上三类情况的语义相似度计算精度.
其他文献
文本解读,是开展阅读教学的第一步。教师必须准确把握文本的脉搏,与文本全方位接触,关注"语言之外"的东西:关注作者留下的"讯息",读出内心世界的复杂斗争;关注作者打开的"门缝",读出
内蒙古某斑岩型铜多金属矿位于华北兴蒙造山带东段多个地块相互作用带和古缝合带边缘,区内地质体不连续增加了地质找矿难度。结合相关地质勘探成果,在分析区域地质特征、矿区
时间制度——“微信签读制”。以班级为单位组建了班级整本书阅读的微信群,每天让学生或家长在群中进行1~2分钟的语音汇报,汇报内容包括阅读书名、阅读进度、阅读感言、精彩片段
文证审查的概念源于1988年《人民检察院法医工作细则(试行)》第20条,该条规定:法医文证审查主要是对起证据作用的法医鉴定书,司法精神病鉴定书,医疗事故鉴定意见书,病历以及现场
作后讲评是提高学生习作水平的关键.遵循序列,按“欣赏-挑刺-训练”的“套路”走,扎实有效地达到习作方法一课一的目标;学会取舍,每节讲评课的讲评点一两个即可,涉及篇目也不
旋耕机具有耕耙合一,一次旋耕能达到一般犁耙几次作业的效果,既能用于农田旱耕和水耕,也适应盐碱地的浅层耕作和覆盖,由于其工作可靠,作业效率高,在春耕时深受农民青睐。 一、旋耕机的使用技术 1. 旋耕机的结构 旋耕机由刀轴、弯刀、支臂、主梁、悬挂架、齿轮箱、传动箱等组成(如图)。 2. 旋耕机的安装方法 ①旋耕机的安装。安装三点悬挂式旋耕机时,应先切断拖拉机输出轴动力,取下输出轴罩盖,待挂好
本文分析了目前实验教学中存在的一些问题,对普通物理实验课的教学内容、教学方法、考核方式及师资队伍建设等方面提出了几点改革设想。
【正】 由科技部、商务部、中国国际贸易促进委员会和北京市人民政府联合主办,信息产业部、国家发展和改革委员会、教育部、公安部、铁道部、交通部、农业部、卫生部、国家人
掌上电脑已经越来越普及了,说不定您就会想为自己购买一款掌上电脑来娱乐、工作、学习。但是如今在掌上电脑市场上,鱼龙混杂,各种各样的掌上电脑会令你眼花缭乱,其外形,尺寸和颜色
当前,研究生教育面临日趋严重的就业压力,其深层次原因既有教育体制问题,也有用人单位和研究生个人的因素。要提高研究生就业率,需要学校、研究生个人和社会三管齐下:社会应