基于汉语多词块的语料库研究

来源 :第四届全国学生计算语言学研讨会(SWCL-2008) | 被引量 : 0次 | 上传用户:wdxswdxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
组块分析是自然语言的处理研究领域中新近出现的一个语言处理策略,它能有效降低句法分析的难度。本文在汉语多词块描述体系的基础上,阐述了汉语多词块库中块的结构,并对库中块的各种标记进行了深入地统计和分析。经过测试,汉语多词块库是一个较准确的参照库,在今后汉语多词块的自动识别研究中,可以很好地得到应用。
其他文献
提出了一种基于ASP和ADO技术的在线点播系统方案,给出了详细的系统设计和数据库设计过程,该方案易于实现,具有良好的系统开放性和可扩充性。 A scheme of online on-demand
语义角色标注为谓语动词的论元及附属成分分派语义角色,从而得到句子的浅层语义结构。本文针对两类中文特殊句式“把”字句和“被”字句的句式特点,提出了一种基于规则的语义