中文分词技术的研究及在Nutch中的实现

来源 :科技信息 | 被引量 : 0次 | 上传用户:sgzhou22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了中文分词技术的原理,比较了现有分词器的速度和准确性。通过研究开源搜索引擎Nutch的架构和工作流程,分析了源代码,在Nutch加入JE中文分词器,实现了Nutch的本土化。
其他文献
近年来,随着职业教育文化基础课的改革不断深化。以能力本位教学模式改革的实践与理论得到了普遍推广。本文探讨了能力本位教育在中职英语教学中的应用,认为在“学以致用”的原
网络安全问题已危险到了网民的个人隐私,同时威胁到了一个网站的发展。本文分析了基于ASP网站的安全问题。由于ASP广泛应用,基于ASP的同站也日益增多,其安全性得到了大家的关
提高古诗词的鉴赏水平,要做到以下三点:一、知背景,看生平;二、理情物,析情怀;三、品情言,赏情艺。