论文部分内容阅读
本文介绍了利用文本中通用词的覆盖率和文本长度两个因素,通过计算文本难易度,对大规模文本进行自动初步难易分类.实验发现,综合考虑文本的通用词覆盖率和文本长度比仅根据其中一个因素对文本进行难易度分类效果更佳.针对本次实验所用实验语料,当通用词的覆盖率系数α取0.1,文本长度系数β取0.9时,区分效果最佳.