面向信息处理的“而”类短语研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户：zhwenh_0421

【摘要】

：

本文以2000年的人民日报为研究载体，共计24，181，518字，根据不同考察目的逐条分析标注，统计，得出数据，找出规律。本文先研究连词“而”识别规则，再对“形1+而+形2”格式的识别规则进行

【作者】

：

叶美千

【机构】

：

上海师范大学

【出处】

：

上海师范大学

【发表日期】

：

2007年期

【关键词】

：

语料预处理分词歧义识别规则

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文以2000年的人民日报为研究载体，共计24，181，518字，根据不同考察目的逐条分析标注，统计，得出数据，找出规律。本文先研究连词“而”识别规则，再对“形1+而+形2”格式的识别规则进行研究，最后，考察了“为A而B”格式的识别规则。文章共分8章部分，共五部分。第一部分，从第0章到第2章，文章对前人的研究做了综述，对语料进行了预处理，对文章中所用到的变量，规则，条件表达式都进行了详细地说明。第二部分，从第3章到第4章，文章详细地描述了含“而”的双音节短语在语料中所出现的分词歧义现象，并对它们进行了消歧规则的研究，从而作了语素“而”的识别规则。第三部分，即第5章，文章对含“而”的多音节短语情况进行了考察并建立了两个词表，普通词表和常用短语表，分别收词90个和1158个。第四部分，从第6章到第7章，文章进行了“而”和介词构成的特殊格式的识别规则研究。我们首先进行了“形容词1+而(又)+形容词2”格式的识别规则研究。在此基础上我们进行了“介A而B”特殊格式的计算机自动识别规则的考察，并以“为A而B”格式为特例做了自动识别规则研究。第五部分，即结语部分。本文的研究以实现汉语句法自动理解为目标，以语料库为基础，进行汉语句法规则的归纳和描述。研究的成果将促进语料库建设的发展、为现代汉语研究提供新的课题并促进汉语研究的现代化，同时也将推动汉语自然语言信息处理的研究向纵深发展。

其他文献

汉语方言名词重叠研究

重叠是汉语乃至汉藏语系中一种重要的语法手段。它不仅存在于汉语普通话中，在汉语不同方言中也有旺盛的生命力。本文对汉语方言中的名词重叠现象做了较为全面、细致的探究，以期

学位

汉语方言名词重叠构成形式口语表达

小波神经网络在径流预测中的应用研究

将小波变换应用到径流序列分析中,获得了黄河陕县水文站109年径流序列的组成情况和变化趋势.用BP神经网络与小波变换相结合,对该站109年径流序列进行了研究,认为:①小波网络

期刊

小波变换BP神经网络小波网络径流预测陕县水文站黄河

地形地籍测绘项目精细化管理研究与实践

本文以我市绥江县城镇地形地籍成果更新项目为例，研究了精细化管理在项目前期、中期和后期各阶段发挥出的不同作用。

期刊

精细化管理地形地籍测绘项目质量控制研究实践

头疼脑热也许是大病

平时大家不舒服，很多人都会用“头疼脑热”来表述，但是专家却提醒大家，如果生活中你真的有了“头疼脑热”，可千万别像说出的语气那样轻描淡写，这有可能是潜伏疾病的预警。　　　　感冒发烧“关键”48小时　　　　【本刊记者】黄教授，感冒发烧可能是大家最常见的疾病，那么当我们感冒发烧了，该怎样就诊呢？　　【黄建始】如果确定是感冒，比如有明显的鼻塞、咽喉疼痛、打喷嚏等症状，这种情况就诊相对比较简单，到内科就

期刊

“食不厌精”浪费了多少营养!

在当今工业化社会里，我们日常食用的各种粮食绝大部分均需加工处理，而如何加工才能符合人们的需求，加工过程中追求什么样的目标是很有学问的。如果粮食加工过程中所持有的理念出现偏差，那将带来损害健康的严重后果。　　　　　　大米过细加工是错误理念的产物　　　　近日，看到一篇媒体报道：题目叫《中国大米盲目追求精细化，每年损失2000万人口粮》，文章指出，吉林五常香米抛光加香、泰国香米造假等问题广泛受到关注，这

期刊

“不谈爱情”的理想主义——论池莉小说爱情观的非世俗化倾向

本文主要从池莉小说中爱情观着手，来分析其创作中非世俗化的一面，以使读者了解到一个更加全面的池莉。关于池莉小说中爱情观的非世俗化倾向，主要从以下五章内容来论述：第

学位

中国当代文学池莉小说爱情观非世俗化倾向

试论工程地质勘察钻探中的取样

本文分析了取样工作是整个工程地质勘察钻探工作的重点与难点，提出了准确的样本才可以检测出准确的结果，探讨了工程地质探测工作的精密与准确性，为了未来可以将取样工作与计算机

期刊

工程地质勘察钻探取样

中西医的误会

医学在中国有两套体系，中医和西医，可是经常挂在嘴上的医学名词并不完全一样，隔行如隔山，有时候难免会犯一些最基本的、最常识性的错误。比如最常说的五脏六腑，心、肝、脾、肺、肾、胃、大肠、小肠、三焦、膀胱、胆。这些属于中医的用词，有些和西医用词相同，但意思却是千差万别。　　　　心病不是心脏病　　中医的心主要生理功能是：主神明，主血脉，主汗，开窍于舌等；而西医的心指，心血管系统的动力器官，并具内分泌功能。

期刊

关于既有建筑物地基基础检测与评定技术的探讨

随着城市化进程的不断加快，各项基础设施建设速度和规模得到不断的增速和扩大。因此建筑物的质量逐渐开始引起了更多人的关注。本文主要通过对建筑地基基础的各项测试与评定技

期刊

既有建筑地基基础检测评定

“土改小说”再解读——以“空间”为视角

在20世纪四五十年代中国大地上，中国共产党领导农民进行了一场轰轰烈烈的土地改革运动，对中国社会的发展产生了深远的影响。而这一时期的许多文学家以其特有的敏感和直觉，不仅以

学位

土改小说土地改革运动政治空间政治意识形态

面向信息处理的“而”类短语研究

其他学术论文