汉语自动分词实用系统CASS的设计和实现

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:qaz370724qaz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,汉语自动分词成为中文信息处理的一大热门课题,其研究进展令人关注。本文主旨,是通过介绍CASS系统的设计和实现,阐述汉语自动分词实用系统的一般性原理,包括系统的总体结构、自动分词算法和分词词典的实现、各种多义切分字段的识别和处理,等等。CASS系统由总控程序、自动分词程序、设施管理程序、分词词典和知识库等五大部分组成。自动分词算法程序选用正向增字最大匹配法ASM(+1,+1,+1)实现,该算法的嵌套调用,可以识别出各种多义切分字段,包括任意多重的交集型多义字段。这个算法经过相应的运行控制,可以实现其
其他文献
上海师范大学预科留学生汉语教育具有其特殊性,汉语写作对预科留学生来说具有一定的难度,并且在对外汉语听说读写四种语言技能中,汉语写作是预科留学生最为薄弱的技能之一。
<正>近年来,江苏省常州市民政局将"互联网+"思维和高新技术应用于地名普查成果转化,充分发挥互联网的集成优势和信息通信技术及时高效的特点,构建了多样化的服务与共享模式,
汉语和越南语都属于孤立语的语言系统。句法意义主要取决于语序和虚词。两者有很多相似的地方,但同中有异,也存在许多不同的地方。正是因为这个原因导致越南学生学习汉语的过
我国在实现现代化的进程中,迫切需要理工科大学培养大批具有创新素质和能力的科技人才。研究我国理工科大学创新人才培养系统及其运行机理,并构建创新人才培养的运行机制,对
勇敢作为人的一种卓越品质,有一个由肯定、审慎和否定三个环节构成的稳固结构,但在不同时代却有不同的形态。过于时代"尚武的勇敢"一直是勇敢的主导形态,但我们这个时代最需
欧元自启动以来,经历连续三年的贬值后开始升值;欧盟欠佳的经济表现、美国奉行强势美元政策和欧央行相当时期内的“不干预”,是欧元贬值的主要原因;欧元进入流通、欧美间利差
在简述人耳听觉构造和基底膜选频特性的基础上,详细介绍了解释人耳音高感知现象的两个心理声学基本理论,即"部位学说"和"时间论",同时介绍了部位学说和时间论在解释人耳音高
<正>缘起对于生活在21世纪的人们来说,项羽是一个传奇。许多传说、许多成语描绘出一个千古传诵的英雄。但当我们寻找他在历史中的真实面容时,一切却又是模糊的,模糊得只有一
20世纪60年代以来,西方科幻电影渐次描绘了一幅"机器视觉逐渐侵入自然视觉"的图景,为我们观察后人类视觉的可能性构想提供了一个有益的窗口。晚近以来,"赛博格之眼"从增强视
无论是就新闻语体还是文艺语体而言,标题在文章中占有重要的地位,被称为是文章的眼睛。随着数字媒体的发展、快餐式生活的加剧,标题在传递信息的过程中扮演者至关重要的角色,