基于内容和分层结构的XML文件自动分类方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:DIWUTANG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种以XML文件内在的分层结构为基础的文件分类方法,井与改良的VSM方击的实验结果进行了比较。和以往XML文件的分类方法不同的是.此方法更加注重XML文件特有的结构信息。首先利用TF-IDF方法针对XML文件非蛄构的信息产生一般特征集,然后再针对XML文件各个屡次重要性赋予一定的权重。从而产生层次特征集,然后根据一些领域知识,产生知识特征榘。将三个特征集结合起来对XML进行分类。试验结果表明,这种方法比改良的VSM方法在分类的准确性方面有大幅的提高。
其他文献
随着现代桥梁技术的发展,挂篮悬浇施工已经是桥梁施工中比较常用的施工方法,其中轻型挂篮的应用更是使桥梁的施工质量和施工进度有了更大的提高。但是挂篮主桁架在施工过程中和
在新的形势下,宣传思想工作必须以"三个代表"重要思想为指导,紧紧围绕改革、发展和稳定的大局进行理论创新,同时要加强机制创新,切实把宣传思想工作落到实处.
企业文化是当今企业生存和发展的灵魂.在国有企业深化改革过程中,必须重视企业文化建设.为此,应分析企业内外因素,选择正确的价值标准;进行感情投资,增强企业意识;领导者身体
提出了一种TCP协议穿透SymmetricNAT的解决方案,该方案利用Symmetric NAT的端口可预测性.采取双方同时打开TCP连接技术,实现了在不同Symmetric NAT之后的主机问的TCP直连,经测试
科学意义上的现代心理学是于19世纪下半叶在德国作为哲学而诞生的,它是哲学在从其近代形式向现代形式过渡过程中的一个特殊的表现形式.冯特心理学的理论企图,是想在现代哲学