论文部分内容阅读
该文介绍一种基于约束规则与无监督学习的词类分析方法。在模型实现中,以独立于语料库的手工制作的约束规则为出发点,然后合并从训练语料库中以无监督方式所学习的约束规则,语言学地激发手工制作的约束规则,同时不以牺牲查全率为代价而提高查准率。方法中也利用所谓的“词法启发式”处理语料库中所遇至蝗未登录词。测试结果说明,在针对英语的词类分析中,通过组合这些手工制作以及所学习的信息源,可获得大约97℅的查全率,92℅的查准率,以及平均1.05个歧义分析/单词。