基于统计分布与集合论的文本分类方法

来源 :北京理工大学学报 | 被引量 : 0次 | 上传用户:redkind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
指出基于TfIdf的常用文本特征提取方法在文本分类问题中的缺陷,进而提出使用特征词的分布状态、词频和文本频三者相结合的方式提取文本特征的观点,给出了计算特征词权重的新方法,提出了新的文本分类方法.试验表明,该方法能够最大限度保留文本的特征,并且可有效避免向量空间模型中的维数灾难问题,能应用于大规模文本分类.
其他文献
由法国爱博展览集团和(中国)商业发展中心共同主办的第十一届中国国际食品和饮料展览会(SIAL CHINA 2010)将于2010年5月19日至21日在上海新国际博览中心隆重展出。
为了提高综合传动密封装置的可靠性和耐久性,在对密封环磨损机理和失效特性研究分析的基础上,应用模糊理论建立综合传动铸铁密封环的模糊可靠性模型,推导出模糊可靠度计算的
对交流毫米波引信的目标识别与定位方法进行研究.分析了毫米波引信探测金属目标的机理;在对装甲目标进行试验测试的基础上,研究了坦克装甲目标与干扰的毫米波信号差异;根据目标特
运用有限元手段对刀桥导轨的刚度进行了有限元分析,得到了刚度方面的分析结果和模态分析结果,并在不同位置加40N载荷进行实验验证。在此基础上,对原有的结构进行一体式结构优
<正>经济全球化是不以人们意志为转移的、不可逆转的、持续演进的客观进程。正如习近平主席指出:"经济全球化是社会生产力发展的客观要求和科技进步的必然结果。"经济全球化
会议