面向信息处理的“而”类短语研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:zhwenh_0421
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以2000年的人民日报为研究载体,共计24,181,518字,根据不同考察目的逐条分析标注,统计,得出数据,找出规律。本文先研究连词“而”识别规则,再对“形1+而+形2”格式的识别规则进行研究,最后,考察了“为A而B”格式的识别规则。文章共分8章部分,共五部分。 第一部分,从第0章到第2章,文章对前人的研究做了综述,对语料进行了预处理,对文章中所用到的变量,规则,条件表达式都进行了详细地说明。 第二部分,从第3章到第4章,文章详细地描述了含“而”的双音节短语在语料中所出现的分词歧义现象,并对它们进行了消歧规则的研究,从而作了语素“而”的识别规则。 第三部分,即第5章,文章对含“而”的多音节短语情况进行了考察并建立了两个词表,普通词表和常用短语表,分别收词90个和1158个。 第四部分,从第6章到第7章,文章进行了“而”和介词构成的特殊格式的识别规则研究。我们首先进行了“形容词1+而(又)+形容词2”格式的识别规则研究。在此基础上我们进行了“介A而B”特殊格式的计算机自动识别规则的考察,并以“为A而B”格式为特例做了自动识别规则研究。 第五部分,即结语部分。 本文的研究以实现汉语句法自动理解为目标,以语料库为基础,进行汉语句法规则的归纳和描述。研究的成果将促进语料库建设的发展、为现代汉语研究提供新的课题并促进汉语研究的现代化,同时也将推动汉语自然语言信息处理的研究向纵深发展。
其他文献
重叠是汉语乃至汉藏语系中一种重要的语法手段。它不仅存在于汉语普通话中,在汉语不同方言中也有旺盛的生命力。本文对汉语方言中的名词重叠现象做了较为全面、细致的探究,以期
平时大家不舒服,很多人都会用“头疼脑热”来表述,但是专家却提醒大家,如果生活中你真的有了“头疼脑热”,可千万别像说出的语气那样轻描淡写,这有可能是潜伏疾病的预警。    感冒发烧“关键”48小时    【本刊记者】 黄教授,感冒发烧可能是大家最常见的疾病,那么当我们感冒发烧了,该怎样就诊呢?  【黄建始】 如果确定是感冒,比如有明显的鼻塞、咽喉疼痛、打喷嚏等症状,这种情况就诊相对比较简单,到内科就
期刊
在当今工业化社会里,我们日常食用的各种粮食绝大部分均需加工处理,而如何加工才能符合人们的需求,加工过程中追求什么样的目标是很有学问的。如果粮食加工过程中所持有的理念出现偏差,那将带来损害健康的严重后果。      大米过细加工是错误理念的产物    近日,看到一篇媒体报道:题目叫《中国大米盲目追求精细化,每年损失2000万人口粮》,文章指出,吉林五常香米抛光加香、泰国香米造假等问题广泛受到关注,这
期刊
本文主要从池莉小说中爱情观着手,来分析其创作中非世俗化的一面,以使读者了解到一个更加全面的池莉。 关于池莉小说中爱情观的非世俗化倾向,主要从以下五章内容来论述: 第
医学在中国有两套体系,中医和西医,可是经常挂在嘴上的医学名词并不完全一样,隔行如隔山,有时候难免会犯一些最基本的、最常识性的错误。比如最常说的五脏六腑,心、肝、脾、肺、肾、胃、大肠、小肠、三焦、膀胱、胆。这些属于中医的用词,有些和西医用词相同,但意思却是千差万别。    心病不是心脏病  中医的心主要生理功能是:主神明,主血脉,主汗,开窍于舌等;而西医的心指,心血管系统的动力器官,并具内分泌功能。
期刊
在20世纪四五十年代中国大地上,中国共产党领导农民进行了一场轰轰烈烈的土地改革运动,对中国社会的发展产生了深远的影响。而这一时期的许多文学家以其特有的敏感和直觉,不仅以