基于跨语言词向量模型的蒙汉查询词扩展方法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:kccsong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨语言信息检索指以一种语言为检索词,检索出用另一种或几种语言描述的一种信息的检索技术,是信息检索领域重要的研究方向之一。近年来,跨语言词向量为跨语言信息检索提供了良好的词向量表示,受到很多学者的关注。该文首先利用跨语言词向量模型实现汉文查询词到蒙古文查询词的映射,其次提出串联式查询扩展、串联式查询扩展过滤、交叉验证筛选过滤三种查询扩展方法对候选蒙古文查询词进行筛选和排序,最后选取上下文相关的蒙古文查询词。实验结果表明:在蒙汉跨语言信息检索任务中引入交叉验证筛选方法对信息检索结果有很大的提升。
其他文献
近年来,随着全球经济一体化进程的加快,以及高科技的飞速发展和信息时代的来临,大企业竞争的特征、内容、方式等都发生了很大变化,企业竞争力问题已成为社会各界关注的焦点.
语文是小学教学工作的重要课程,在新课标要求下,小学语文教学势必要进行一轮新的改革创新,以顺应教学改革趋势,满足学生学习需求。单元整体教学法是提高语文教学质量的有效手
2009年至2013年,湖北省烟草局实施了"五年人才计划",引进了大批优秀的大学生充实烟草队伍。十年来,襄阳烟草大学生从"职场新人"成长为"中坚力量",分布在不同的领域、岗位,发
期刊
目的:建立山梨醇的毛细管气相色谱分析方法。方法:山梨醇经乙酸酐衍生化为沸点较低的山梨醇六乙酯,用HP-5毛细管色谱柱分离,火焰离子化检测器(FID)进行检测。色谱柱温度为220℃、
为增强我国养老产业发展动力和促进其蓬勃发展,政府协同社会资本构建起养老产业PPP模式,旨在通过养老产业ppp项目运行构建起较完善的养老机制。养老产业PPP项目在政府的指导
目前,市场上出现的爆米花品种单一,多为玉米制成的产品,添加各种添加剂,而且价格并不便宜。异域爆米花是新疆的鹰嘴豆制成的,在市场上属于空白部分,推广新产品是相对复杂的,
社会主义市场经济的快速发展,导致我国工程建设事业的发展步伐逐渐加快。当前计算机技术得到了快速的发展,并且得到了广泛的应用。在工程项目管理中也开始运用了计算机应用技
讨论了图形-背景理论的基本内容,介绍了该理论的心理认知基础及其语言学涵义,并探讨图形-背景理论在大学英语写作教学中的具体应用,以及该理论与大学英语写作教学方而的联系
渤海湾盆地冀中坳陷深层古潜山油气资源勘探程度较低,但仍具有良好的资源潜力和勘探前景。为此,通过综合分析成藏地质要素,结合有机地球化学分析及流体包裹体等测试结果,研究
针对内蒙古河套灌区井渠结合膜下滴灌这一灌排发展趋势,分别选取了黄灌(H)、井灌(J)、滴灌(D)3种灌溉模式,研究了土壤温度时空变化规律和生育期盐分平衡状况。结果表明:玉米生育期内