面向农村医疗的分布式文本检索关键技术研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:binglei2_zj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前农村医疗的信息化建设还不完善,与农村常见病相关的医学数据利用率低、数据量大,如何从这些数据中准确、快速的检索到需要的数据,为农村赤脚医生和农村居民提供帮助,是农村基本医疗卫生关键技术研究的目的,而分布式文本检索技术可以解决上述问题。本文主要对分布式文本检索的关键技术展开研究,研究的关键技术主要包括:分布式检索模型、分布式创建索引、分词工具、权重计算公式等。研究分析了常用检索模型及分布式技术,设计了分布式检索模型;通过采用Hadoop框架及MapReduce编程技术,实现了分布式的创建索引;选取了合适的分词工具,并构建了合理的停用词词表和扩展词词表;经过比较分析常用的权重计算公式,改进了权重计算公式;通过对这些关键技术的研究及优化,设计开发了面向农村医疗的分布式文本检索框架,对检索框架的检索性能进行了详细的实验,并对实验结果做了的细致分析。经过实验测试,本文设计并实现的分布式文本检索框架在检索医学数据时具有很好的检索性能,不仅缩短了文本检索的时间,而且提高了文本检索的准确性,可以很好的为农村医生和农村居民提供服务。
其他文献