汉语语句中短语间停顿的自动预测方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:yijiezhented
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文语转换(TTS)系统中,正确标记短语间的停顿对提高合成语音的自然度起着重要作用.本文介绍了一种在汉语语句中自动预测短语间停顿的方法.首先,文本进行分词,并转换为一列由词性标记所组成的序列;然后使用马尔可夫模型,利用人工标注数据库训练词语连接处词性标注序列的概率分布和连接类型序列的距离信息,得到输入的词性标记序列对应的具有最大似然概率的连接类型序列,最后利用后处理规则进行适当的纠错.本文针对不同的模型参数进行了测试,短语间停顿自动预测的召回率和连接类型正确率分别达到了68.2%和85.1%,取得了比较满
其他文献
一个周末和家人视频聊天,中途妈妈扭过头跟爸爸说:“你先去把大米用水泡上。”之后又对着我说:“电视上说,如果每家每户做米饭之前都能先泡十分钟,全国可以省好多电。”
目的了解1993年和2001年安徽省枞阳县15岁以上农村居民的吸烟模式及相关因素变化情况。方法采用随机整群抽样调查、描述性分析和非条件logistie回归分析。结果总吸烟率、现在
本文从形式化的角度讨论了汉语文本的形式结构及有关的基本概念,给出了文本的标题、子标题、段落及其层次结构的一种划分与标记方法,提出了规范的与准规范的文本等概念,并以
目的探讨腹腔镜对异位妊娠诊治的价值.方法采用腹腔镜下诊治56例异位妊娠.术中应用不同手术方法治疗异位妊娠.结果56例异位妊娠全部在腹腔镜下得到进一步诊治,无中转开腹.结
“十二五”规划前期研究工作已经启动。每次制定五年规划都遇到目标量化问题,而量化过程中遇到的基本问题是确定标准和基础数据采集,这几乎成为所有主体规划和单项规划中的瓶颈
中国经济的快速发展,重化工化和城镇化进程的加快,常规能源的支撑能力已经受到了严峻挑战,资源的制约和环境状况的恶化,迫切需要改变低效、高污染的能源结构。但是,作为清洁能源的
令人回味的2009年即将过去。纳入世界经济大背景之下去回首中国经济过去一年的变化,尽管过程很艰难,也有一些不确定性,但从运行结果看,却是令人赞叹的:在世界经济环境的逆风之