特定领域的汉语语言模型平滑算法比较研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:liongliong484
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了完成特定领域的语音识别任务,利用有限的语料建立高性能的语言模型成为提高系统性能的关键.针对此问题,对特定领域的语言模型进行了研究.提出了利用高频新词来加强模型的领域特征的方法,采取了两种方案:一种是将高频新词直接加入原有字典,并在训练过程中增加这些新词的权重,使模型更能表达与领域相关的特征;一种是基于高频新词统计出一个和领域相关的小词表,并对这两种方案进行了比较研究.通过实验研究了适合汉语语言的平滑策略.最后,实验结果表明,对于特定领域问题,语言模型平滑算法对模型性能影响较大;采用适合汉语的Witte
其他文献
随着分布式服务的发展,服务提供者一方面总是期望提供尽可能通用的服务,而另一方面却期望能够细致地区分每个用户可以调用的服务,现有的RBAC模型很难解决这种矛盾。论文在研究现
一个ElGamal签名方案的变种被提出。在此基础上,提出了一个在random oracle model中可证安全的可追踪(t,n)门限签名方案。在这个全新的门限签名方案中,签名人的身份可以在需要的时
Adhoc网络节点能量受限的路由协议的研究是目前的一个热点,IETF的MANET小组提出的几种经典的路由协议,属于最短路由,即最小跳数路由,没有考虑能量因素。由于Adhoc网络中的节点是
文章详细描述了如何在内核空间对QT电源管理模块提供底层支持,并且提出了基于Qt/Embedded电源管理的技术实现.主要包括LCD与背光管理和电量检测。
移动IP借助定期广播的代理通告完成移动检测。与移动IP原本应用的无线局域网环境不同,在移动Ad Hoc网络中频繁的广播会造成广播风暴。现有的集成移动IP与移动Ad Hoc网络的方案