基于规则和统计的组合类新词识别技术研究及其在机械产品设计中的应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ZWCSS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究自然语言理解中的组合类中文新词识别,通过识别新词,使分词结果更加合理准确,结合自然语言理解系统的后续处理,最终通过对以自然语言形式表达的用户需求进行理解和分析,将分析结果转化成概念设计要求或设计参数,为后续设计提供支持。本文首先分析了自然语言理解中几种常用的知识表示方法,阐述了概念从属理论在知识内涵和外延描述中的作用,以及自然语言理解研究中的统计模型,以此作为分析组合类中文新词识别的理论基础。其次,以语言学知识为理论依据,分析组合类中文新词的构词模式,明确了分类标准,将组合类中文新词分为三类:“单字串类型”、“后缀串类型”和“其他类型”;并通过字词禁用表、词性搭配禁用表、词缀表对候选词串进行筛选;同时,借助概念从属树模型,分析新词构成元素间的概念关联关系;然后收集候选词串的上下文信息,通过统计语言模型,分析组合元素的内部紧密程度和上下文依赖程度,采用内部词概率、互信息和左右信息熵作为统计方法识别新词的标准;总体上采用规则和统计相结合的方法进行组合类中文新词的识别。最后设计了组合类中文新词识别的整体流程,并通过机械设计实例,将组合类中文新词识别的分析模型应用在产品设计领域自然语言理解中。
其他文献
目前影响胚胎种植的因素很多包括宫腔粘连、输卵管积水,宫腔形态异常、输卵管积水、子宫内膜受损,但治疗这些疾病之后,仍会出现多次移植高质量胚胎仍未妊娠,称为反复植入失败
意境是中国古典美学中一个引人注目的范畴。意境的形成根因于中华民族传统文化的土壤,体现出中华民族的文化心理和审美意识,体现出中国哲学对中国美学的影响,进而反映在中国
针对低电压微电网中带非线性负荷的多逆变器并联系统,提出了一种分频虚拟电阻的多逆变器并联控制策略。对每个逆变器的输出电流采用带通滤波器进行分频,得到各次谐波电流;通
《汉语书面语渐进练习》(Progressive Exercises in the Chinese WrittenLanguage)(1912)是英国外交官、牛津大学汉文教授布勒克(T.L.Bullock)编写的一本初级汉语书面语学习用书。
作为汉语词汇系统中一类特色鲜明的词汇群体,典故词语不仅为人们的语言创作注入鲜活的典故因子,同时也丰富了人们的文化内涵。伴随时代的发展和历史考验,有的典故词语仍活跃在社
中医养生学认为,阳气的虚衰会给身体带来很多问题。"阳强则寿,阳衰则夭",所以,阳气决定健康和长生。银屑病虽然表现在皮肤上,根本原因在于肾,在于机体内元气,治疗银屑病必须
文章结合目前限额以下工程经常出现的问题,提出限额以下工程监督管理办法和对今后工作难点的对策。
<正>农历二月初二,"龙抬头",象征春回大地,万物复苏。这一天理发,叫"剃龙头"或"剃喜头"。借龙抬头这一吉时,辞旧迎新,希望带来好运。民谚有"二月二剃龙头,一年都有精神头"的
期刊
睡眠是人类必需的生理活动,睡眠能够使人从疲劳的状态中恢复过来,使人保持良好的状态。夜晚的整夜睡眠是睡眠的一个主要方式,也是人恢复身体状况的主要途径;白天的短时睡眠对
天气属性义场是现代汉语的基本义场。本文以天气属性义场中的五个代表字“凉”、“暖”、“燥”、“晴”、“热”为研究对象,运用语料库技术方法,对其在现代汉语中的义项分布