健壮性学习算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:birdinfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用统计方法可以对汉英机器翻译的词性标注和句法语义分析阶段产生的歧义进行消歧,在估计过程中往往使用最大可能方法,但是并不是在所有的情况下取最大值都是正确的.为了从所有候选结果中取到正确的结果,本文使用健壮性学习算法.使用这个算法,当正确的候选结果评分不是最高时,仍能通过健壮性算法来调整正确结果的评分,使之最大,并且降低不正确候选的评分.而且,由于训练集与测试集存在不同,使训练集中的错误率最小不能保证测试集中的错误率也最小.因此当考虑训练语料库和测试语料库存在统计变化时,应该使用健壮性学习算法.
其他文献
现代汉语文本自动分词是中文信息处理的重要基石,为此提供一个通用的分词接口是非常重要的.本文提出了通用分词接口的目标,论述了它的原理和设计方案.该系统已经初步实现.
抽油机井示功仪测试的上、下漏失曲线反映了抽油杆在静止状态下的受力.本文提出了利用漏失曲线计算悬点静载荷的方法,分析了上、下漏失曲线的载荷组成;建立了测试上、下漏失