论文部分内容阅读
采用开放协同编辑模式的维基百科,其内容的精确性一直受到人们的质疑。除了极少部分被维基百科认定为高质量文章外,维基用户很难判断其余大部分文章的质量。对此,本文将维基百科中页面信息作为样本数据,把页面信息质量评价问题抽象为一个分类问题,构造了基于决策树C4.5的维基百科页面信息质量评价模型。并从页面编辑者情况和页面情况两个方面提出影响维基百科页面信息质量的15个的指标,给出了各指标的定义以及计算公式。最后,训练一个自动的页面信息质量分级评价模型并进行了有效性验证。实验证明,本文提出的维基百科页面信息质量分级评