基于字、词、词组的中文搜索引擎分词系统

来源 :武汉工业学院学报 | 被引量 : 0次 | 上传用户:zhf2003168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析了全文检索系统中常用的基于字表和基于词表的中文分词方法的优缺点,提出了基于字、词、词组混合模型的中文搜索引擎分词系统;并利用广义语词概念,设计了分词词典,改进了最大匹配分词算法(MM);最后把分词系统应用于全文检索中.
其他文献
一切社会科学和人文科学研究皆涉及人的研究,并且从不同的角度去追求人的应然存在方式。作为一门应用伦理学,经济伦理学从自己的学科要求出发,试图消除经济人与道德人以及经济学
在社会竞争日益激烈的情况下,残疾人就业面临巨大的困境,如何解决残疾人就业,是当今社会急于解决的问题,本文结合残疾人就业面临困境的原因及对策进行简要的分析与探讨,以求与大家
随着中国经济的不断发展及资本市场的不断完善,在过去的十多年里,中国的IPO发行制度经历了不断变迁和演进的过程。本文主要从发行审核制度、对我国IPO发行制度的演进过程做了较
当前阅读媒介的变化,特别是数字媒介对纸质媒介的逐步替代,会给读者的认知方式带来哪些影响?本文借鉴媒介环境学的理论框架,采用问卷调查及数据分析的研究方法,从注意、感知、
微积分在各个领域内都发挥了重要的作用,本文主要分析了其在经济方面的应用,特别就微积分在边际分析和最大利润方面所发挥的重要作用予以详细阐述。
孔颖达在继承唐以前儒家文学思想的基础上,顺应时代变化的需求,形成了自己的文学思想。本文从孔颖达亲自撰写的《周易正义序》、《尚书正义序》、《毛诗正义序》、《礼记正义序
我国保税区,始于20世纪90年代初国务院批准设立的上海外高桥保税区。截至2002年底,全国已设立了15个保税区。基本上都位于沿海港口城市、内陆口岸及靠近沿海的内河港区。大都是