论文部分内容阅读
[目的]提出一种公式匹配与文本排序相融合的科技文档检索方法.[方法]利用公式描述结构对数学表达式进行解析得到公式的结构信息,实现基于数学表达式的科技文档检索;同时,通过词嵌入模型投影得到查询关键字的词向量和文档词向量,根据两种词向量之间的相似度对文档集合进行排序.[结果]实验结果表明,方法的查全率和查准率分别为0.77和0.63,相较于传统科技文档检索方法分别提高24.2%和23.5%.[局限]只针对LaTeX格式的查询表达式,在数学表达式描述格式方面有局限性.[结论]数学表达式与文档关键字相结合的科技文档检索模型提高了科技文档检索的性能.