分词方法相关论文
二进制代码相似性检测技术近年来被广泛用于漏洞函数搜索、恶意代码检测与高级程序分析等领域,而由于程序代码与自然语言有一定程度......
随着网络的发展,数字化信息迅速增加,人们对中文信息的处理也越来越关注,同时,现代汉语信息的处理和研究也显得尤为重要,计算机自动分词......
因特网上文本信息的迅猛增长给文本分类的精度与速度提出了新的标准与挑战。这就要求文本分类在提高精度的同时,还要进一步提升训......
在互联网蓬勃发展的今天,互联网上的信息更是浩如烟海。人们在享受互连网带来的便利的同时,却面临着一个如何在如此海量的内容中准确......
通过定义类别聚类密度、类别复杂度以及类别清晰度三个指标,从语料库信息度量的角度研究多种代表性的中文分词方法在隐含概率主题......
汉语自动分词是计算机中文信息处理系统的基础和难题,本文对近年来的汉语自动分词的研究方法与成果进行了分析综述。探讨了分词中存......
本文深入地分析了歧义切分字段产生的根源和性质,把歧义字段从性质上划分为四类,并给出了消除每一类歧义切分字段的有效方法。在对......
为解决各种鱼类病害不能及时诊断的问题,提出了基于网络技术构建鱼类病害诊断系统的思路与方法。系统可对各种鱼病及时进行诊断。......
沧海横流方显英雄本色。越是在困难的环境下,越能体现一个人的特质。而在智慧星光公司总裁白剑波看来,李青龙身上最大的特质是他的......
西藏自治区昌都市洛隆县初级中学 【摘 要】藏文分词是藏文信息处理领域的一项不可缺少的基础性工作,也是智能化藏文信息处理的......
介绍了常用的中文自动分词方法,在此基础上,给出了中文自动分词系统的理论模型,指出评价自动分词系统优劣的性能指标,并对分词系统......
在高校题库内容重复率是评价题库建设质量的一个重要指标,为了快速找到题库中重复题或相似度很高的试题,本文主要研究了基于关键词......
汉语词频统计是汉语言处理的一项基础工程。汉语词汇量巨大,人工统计精度上难以保证。由于存在编码输入、分词等方面的困难,直到八......
汉语自动分词是计算机中文信息处理中的难题,也是文献内容分析中必须解决的关键问题之一.本文通过对已有自动分词方法及其应用研究......
汉语自动分词是中文信息处理的基本问题。从分词的基本理论出发,对近年来中文分词研究的现状进行介绍,指出了能够大幅度提高未登录......
摘要:汉语分词,就是将中文语句中的词汇切分出来的过程。分词技术作为中文信息处理的基础环节,它的解决是计算机自然语言理解、人工智......
汉语自动分词是计算机中文信息处理中的难题。文章通过对现有分词方法的探讨,指出了汉语自动分词研究未来的发展趋势,即传统文本的......
近年来,汉语自动分词成为中文信息处理的一大热门课题,其研究进展令人关注。本文主旨,是通过介绍CASS系统的设计和实现,阐述汉语自......
汉语分词是汉语言处理有别于拼音文字语言处理的特点之一。本文回顾了汉语自动分词的研究历史;对现有的四种计算机自动分词方法进......
本文在大量统计的基础上,论证了计算机自动分词是可行的。CDWSThe Mordern Printed Chinese Distinguishing Word System)是作者设......
藏文分词是藏文信息处理中一项不可缺少的基础性工作。从文本的输入系统〔如智能语句输入法、语音输入、手写输入),到文字处理(如......