采用无标注语料和词“粘连”剔除策略的韵律短语识别

来源 :计算机科学 | 被引量 : 2次 | 上传用户：chenbenxia

【摘要】

：

针对人工标注韵律结构获取大规模语料的困难和问题,利用标点符号能够表示停顿的性质,提出一种采用无标注语料和词"粘连"剔除策略的韵律短语识别方法。对标点符号划分等级,并在利用其模拟韵律边界时对其赋予不同的权重。基于无标注语料构建最大熵模型,并采取Top-K方法实现句子韵律短语边界的自动预测。通过计算相邻语法词词性间的互信息对句子进行"粘连"处理,生成"粘连"单元,并对出现在其内部的韵律边界进行剔除,实

【作者】

：

钱揖丽蔡滢滢

【机构】

：

山西大学计算机与信息技术学院,山西大学计算智能与中文信息处理教育部重点实验室

【出处】

：

计算机科学

【发表日期】

：

2016年02期

【关键词】

：

无标注语料韵律短语边界最大熵(ME) 互信息 Unlabeled corpus Prosodic phrase boundary Maximum ent

【基金项目】

：

国家自然科学青年基金项目（61005053,61100138）, 山西省青年科技研究基金资助项目（2012021012-1）, 山西省自然科学基金资助项目（2011011016-2）, 山西省回国留学人员科研资助项目（2013-022）资助.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于TMS320C5402的数据通讯系统的设计

TMS320C54X系列是TI公司生产的应用于通讯领域的DSP芯片，该系列具有功耗小、高度并行等优点，能够满足通讯领域的实时处理的要求；主要阐述了基于TMS320C5402的数据通讯系统的设计

期刊

DSP数据通讯通用异步收发器CPLD实时传输DSP data communication UART CPLD realtime transmi

正则3-SAT问题的相变现象

通过对3-CNF公式加以限制,要求其中每个变元出现的次数相同,引出正则3-SAT问题。进一步,通过对两种子句产生机制形成的（3,s）-CNF公式进行可满足性观察,发现在规模较小的情况下,

期刊

正则CNF公式SAT问题相变变元自由度Regular CNF formulaSAT problem Phase transitionVariabl

一种新型的摩托车磁电机在线微机检测系统的开发与研究

针对目前我国磁电机产品在线检测设备的落后现状,采用现代微机检测与控制技术开发了一种新型的摩托车磁电机在线微机检测系统;该系统采用独特的设计方法,提高了检测对象的装

期刊

磁电机点火系统在线检测控制magnet generator ignition system： on-line test measurement a

基于自适应神经模糊法的PEMFC温度建模

质子膜燃料电池(PEMFC)工作被认为是21世纪最有希望的绿色发电技术,其原理涉及热力学、电化学、流体力学、传质学等理论,形成一个非线性复杂系统,难以建立数学模型;因此,利用

期刊

质子膜燃料电池(PEMFC)非线性系统建模自适应神经模糊推理系统(ANFIS)PEMFC nonlinear system modeling ANFI

ISDN中2B＋D转USB网络接口设备的实现

ISDN终端产品能独立实现数字电话、传真、图文、视频等多种功能.如果将PC机虚拟成ISDN终端,就可以利用PC机丰富的软硬件资源融合ISDN终端产品的各种功能.文章分析了电信网中

期刊

综合业务数字网ISDN2B+D接口USB网络接口设备ISDN2B+DUSBdigital interfacefirm-ware

基于SPRINT分类算法的异构分布式数据挖掘研究

分类算法是数据挖掘领域最重要的技术之一.随着网络的迅猛发展,分布式环境的日益普遍,分布式数据挖掘已成为近年来数据挖掘中的热点问题.针对目前的数据库多为异构式分布,提

期刊

分布式数据库异构分布式数据挖掘SPRINT分类算法决策树SPRINT classification algorithm DDM heterogen

带补偿的塑料挤压机温度模糊控制

介绍塑料挤压机温度模糊控制系统的设计方法,采用变结构模糊控制算法解决大惯性延迟环节的温度控制,采用补偿算法解决多点加热温度耦合问题,获得较好的控制效果;该设计用于工

期刊

塑料挤压机温度模糊控制补偿plastic extruder temperature fuzzy-logic controller compensati

集对属性软计算方法及应用

集对分析方法的关键是计算联系度,集对关联函数的构建为刻画集合之间的关系、确定联系度表达式提供了一种新的软计算方法。首先,基于粗糙集定义了属性关联函数,探讨了其基本性质;其次,定义了集对关联函数,证明了当集对中任一集合扩充为整个论域时,集对关联函数退化为属性关联函数,进一步探讨了集对关联函数的基本性质;再次,基于属性集与元素集的交并运算给出了集对关联函数的合成运算及运算律;最后,利用实例说明了集对属

期刊

粗糙集联系度属性关联函数集对关联函数Rough set Connection degree Attribute correlation functi

采用无标注语料和词“粘连”剔除策略的韵律短语识别

其他学术论文