【摘 要】
:
为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法。该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进
论文部分内容阅读
为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法。该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进的TFIDF对候选词的特征进行加权合成,去除不符合条件词,求出用户需求向量和待过滤文档向量的相似度,将相似度大于一定阈值的文档提供给用户。从实验参数确定、策略对结果的影响两方面论证了文档信息过滤算法的可行性。实验结果表明,基于多策略的文档信息过滤算法能够提高信息检索的查准率,改善信息检索的质量。
其他文献
通过综合考虑建筑功能与建筑外型的要求、结构的抗侧效率与经济性,深湾汇云中心T1塔楼采用巨型框架-核心筒结构体系。经过弹性与弹塑性分析说明该结构体系能够满足设计的各项
研究和分析了无线自组网中的功率控制的问题。从无线自组织网络中数据通信过程入手,分析了其MAC协议中功率控制的基本思想,并提出了功率控制算法,同时根据该算法改进了CSMA/CA协
目的:探讨宫颈E6/E7检测及液基细胞学检查两种方法联合检测在宫颈癌筛查中的意义。方法:筛选温州市人民医院2014年6月至2015年9月间同时行液基细胞学、E6/E7及组织学检查的病
以珠三角86所高职院校、技师学院的详细数据为依托,从广东实施“双转移战略”以来的产业转型升级以及人力资源结构优化出发,探讨“双转移”战略下珠三角高职教育的发展趋势,即产
针对移动公司业务量大、营销网点多且分散的现状,设计了一套基于B/S结构的移动卡类渠道销售管理系统。该系统设计模式采用“模版方法”,技术框架选择以Spring框架为核心,集成