基于公式描述结构和词嵌入的科技文档检索方法

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:vingf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]提出一种公式匹配与文本排序相融合的科技文档检索方法.[方法]利用公式描述结构对数学表达式进行解析得到公式的结构信息,实现基于数学表达式的科技文档检索;同时,通过词嵌入模型投影得到查询关键字的词向量和文档词向量,根据两种词向量之间的相似度对文档集合进行排序.[结果]实验结果表明,方法的查全率和查准率分别为0.77和0.63,相较于传统科技文档检索方法分别提高24.2%和23.5%.[局限]只针对LaTeX格式的查询表达式,在数学表达式描述格式方面有局限性.[结论]数学表达式与文档关键字相结合的科技文档检索模型提高了科技文档检索的性能.
其他文献