【摘 要】
:
文本分类是中文信息处理的重要研究领域。给文本分配一个或多个不同的类别,可提高文本检索和存储的处理效率。粗糙集是一种不需要任何先验信息的分类方法,通过对文本分词、过
【机 构】
:
西南财经大学经济信息工程学院,四川大学计算机学院,华兴职业技术学院
【基金项目】
:
国家自然科学基金(60803106)资助
论文部分内容阅读
文本分类是中文信息处理的重要研究领域。给文本分配一个或多个不同的类别,可提高文本检索和存储的处理效率。粗糙集是一种不需要任何先验信息的分类方法,通过对文本分词、过滤掉停用词之后把剩余的词语作为特征项,然后把文本用向量空间模型表示出来,将文本集转化成不带决策属性的信息系统,用粗糙集理论中核心内容属性约简实现对文本的分类。实验表明,该方法的查准率和查全率都有所提高。
其他文献
介绍在离高干病房只有8m的复杂环境中,采用“内向坍塌”爆破,成功地拆除被新建冷冻大楼紧紧包在楼内的老冷冻机房的爆破方案,参数和安全防护。
在粤港澳大湾区建设背景下,推进高校众创空间合作发展,可为粤港澳经济发展注入新动能,促进粤港澳高等教育内涵式发展,构建粤港澳科技协同创新体系。在国家大力发展众创空间的
粘附现象是微/纳机构中特有的现象,在构件材料强度满足要求的条件下,微/纳机构中的粘附和摩擦是造成其失效的主要原因。如何防止或减轻粘附已成为微/纳机电系统(MEMS/NEMS)领域的研
本文通过理论计算和实际分析表明,井下爆破空气冲击波对爆破网路有着较大的破坏作用,利用孔底起爆的方法,可有效地防止空气冲击波对爆破网路的破坏。这种方法已在西石门铁矿井下
本文总结了八士 年代以来计算机技术在工程爆破领域中的应用与发展。
创新型人才在提高我国科技创新能力、服务经济社会发展方面发挥着重要作用。我国的研究生教育肩负着国家高层次人才培养和科技创新的重要使命。提出高校要通过推动国际科研项
针对二维CAD工程图的特点,研究了二维CAD工程图复杂度的度量方法。提出了实体复杂度、约束复杂度以及特征复杂度的定义,并分别给出了3种复杂度的计算方法。分析与讨论表明,上述3种复杂度能有效地对二维CAD工程图的复杂度进行度量。最后对二维CAD工程图复杂度在工程图内容加密以及数字水印中的应用进行了探讨。
应用构造染色法,研究了路和圈的广义Mycielski图的邻和可区别全染色,得到了路和圈的广义Mycielski图的邻和可区别全色数.
本文对峒室爆破设计手段的计算机化进行了初步探讨,并给出了地形信息的快速采集和自动处理,多层多排装药的自动布设,爆破漏斗的形成与爆堆的设计等处理方法,为爆破工程设计的现代
核判别分析(KDA)算法仅考虑c-1个判别特征,且计算类间离散度矩阵时需使用所有的训练样本,而一些有利于分类的边界结构未能被提取。为此,提出了一种非参数非线性(核)鉴别分析方法,其在计算特征空间中的类间散布矩阵时引入一个权值函数,从而能提取有利于分类的边界结构。仿真试验表明,新方法在识别性能上优于已有的一些方法,且避免了使用繁琐的矩阵奇异值分解理论,有一定的实用价值。