论文部分内容阅读
本文对实体自动提取及指代消解方法与系统的实现进行了研究。主要内容如下:
⑴ 分别基于最大熵模型和基于条件随机场模型实现了中文实体的自动提取,尝试并比较了整体模型与层级模型两类不同框架,并较为深入地探讨了特征选取。
⑵ 采用类似于ROVER的思想,分别利用投票和置信度的方法选择最大熵模型和条件随机场模型的实体提取结果,提高了系统性能。
⑶ 综合了位置、字符串匹配以及语义等多种特征,训练最大熵分类器建立指代概率模型,根据指代概率的聚类,实现对实体提及的指代消解。