基于LDA—WSVM模型的文本分类研究

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户：kylinbin

【摘要】

：

SVM分类算法处理高维数据具有较大优势，但其未考虑语义的相似性度量问题，而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势

【作者】

：

李锋刚梁钰 GAO Xiao-zhi ZENGER Kai

【机构】

：

合肥工业大学管理学院,阿尔托大学自动化与系统技术系,教育部过程优化与智能决策重点实验室

【出处】

：

计算机应用研究

【发表日期】

：

2015年1期

【关键词】

：

文本分类潜在狄利克雷分布支持向量机权重计算吉普斯抽样 text categorization latent Dirichlet allocation

【基金项目】

：

国家自然科学基金资助项目（71301041）,南京市科技计划资助项目（2012sf542010）,国家留学基金资助项目

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

SVM分类算法处理高维数据具有较大优势，但其未考虑语义的相似性度量问题，而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势并提高分类精确度，提出了一种新的LDA—wSVM高效分类算法模型。利用LDA主题模型进行建模和特征选择，确定主题数和隐主题一文本矩阵；在经典权重计算方法上作改进，考虑各特征项与类别的关联度，设计了一种新的权重计算方法；在特征词空间上使用这种基于权重计算的wSVM分类器进行分类。实验基于R软件平台对搜狗实验室的新闻文本集进行分类，得到

其他文献

求解高维动态0-1背包问题的修补二进制差分进化算法

针对已有的动态优化算法求解高维动态背包问题（DKP)难以获得高质量的可行解，且跟踪环境速度慢，提出了一种修补二进制差分进化算法（BDE/R)用于求解高维DKP。在BDE/R设计中，一种随机

期刊

高维动态0-1背包问题二进制差分进化算法修补策略跟踪性能high-dimensional dynamic 0-1 knapsack problemb

基于MapReduce的FCM聚类集成算法

模糊C-均值(FCM)聚类集成算法是一种利用集成思想提高聚类质量的方法。针对FCM聚类集成算法随着数据量的增加时间复杂度过高的问题,提出一种基于MapReduce框架的并行FCM聚类集成算法。首先利用多组随机的初始聚类中心分别进行聚类来获取具有差异化的聚类成员;然后通过建立聚类成员簇间OVERLAP矩阵来寻找逻辑等价簇,统一所有聚类成员中的簇标记;最后利用投票法共享聚类成员中数据对象的聚类情况得出

期刊

MAPREDUCE聚类集成模糊C-均值并行聚类算法MapReduce clustering ensemble fuzzy C-means（FCM）

基于Petri网的柔性制造系统混惑检测与控制

已有的混惑检测算法需要多次遍历Petri网中的所有变迁寻找混惑,比较耗时,不适合应用在复杂的柔性制造系统中。为此提出了一种新的混惑检测算法,根据混惑的基本结构特征,首先排除一些从结构上就不可能构成混惑的库所和变迁;然后在最有可能出现混惑的库所和变迁中去寻找混惑,从而降低了检测混惑的时间复杂度;再采用抑止弧对系统中出现的混惑进行了一定的消解控制;最后通过一个柔性制造系统实例验证了所提出的混惑检测算法

期刊

PETRI网柔性制造系统混惑检测混惑控制抑止弧Petri nets flexible manufacturing system confusion

手烧伤后瘢痕畸形的防治

手烧伤后瘢痕畸形的防治潘圣鑫广西玉林地区人民医院烧伤整形科（５３７０００）手烧伤在临床非常多见，因为烧伤后引起的手部瘢痕挛缩畸形也很多。因手是人的重要功能部位，手功能障碍对人的劳动

期刊

手烧伤瘢痕畸形预防治疗

DMPA方案治疗Graves眼病的近期疗效观察

ＤＭＰＡ方案治疗Ｇｒａｖｅｓ眼病的近期疗效观察魏松全，童南伟，田浩明，余叶蓉，罗清礼，刘玉平华西医科大学附一院内分泌科，华西医科大学附一院眼科Ｇｒａｖｅｓ眼病（ＧＯ）的治疗，虽方法多种，但并不尽人意。为此，我们根据Ｍｉｅｓｃｈｅｒ等治

期刊

突眼性甲状腺肿强化治疗方案眼病药物疗法

在线商品评论有用性影响因素研究

网络商务发展中产生了大量无效甚至恶意的在线评论，给消费者阅读和参考带来一定负面影响。针对上述问题，提出了一种基于多元线性回归算法的在线评论有用性预测方法。该方法综合

期刊

在线评论有用性影响因素预测模型online review helpfulness influencing factor predictive mo

乌头中毒的特点及治疗：附11例临床分析

乌头中毒的特点及治疗（附１１例临床分析）王雪影四川省绵阳市人民医院（６２１０００）乌头与附子为一类中药，前者是块根，后者为子根，均有毒，其毒性主要由它们共有的乌头碱类生物碱所引起。自１９９０年至１９９５年间，我

期刊

乌头中毒药物中毒中药治疗临床分析

基于函数调用路径的回归测试用例选择排序方法研究

针对在回归测试过程中,因为不断修复软件中存在的缺陷所造成的测试工作量大、测试效率低等问题,将测试用例选择与优先级排序技术相结合,以面向函数调用的路径覆盖生成方法为

期刊

回归测试测试用例选择优先级排序函数调用路径关联性regression test test case selection prioritizatio

一种实时细颗粒度片上网络功率分配方法

片上网络（NoC）不仅直接影响众核芯片的性能，而且消耗了芯片部分功率，在给定功率条件下使得片上网络的性能最优已经成为迫切需求。片上网络中路由器的工作负载（包的到达率）差异很大，

期刊

众核芯片片上网络功率受限性能最优功率分配many-core chip NoC power-limited optimal performan

T3,T4与TSH对甲状腺疾病治疗效果的评价比较

Ｔ３、Ｔ４与ＴＳＨ对甲状腺疾病治疗效果的评价比较李贤蓉，余叶蓉华西医科大学附属第一医院内分泌科Ｔ３、Ｔ４及ＴＳＨ是临床上诊断甲状腺机能是否异常的重要指标，特别是ＴＳＨ尤为敏感，当Ｔ３、Ｔ４还在正常范围时，ＴＳＨ的升高

期刊

甲状腺疾病T3T4促甲状腺激素

基于LDA—WSVM模型的文本分类研究

其他学术论文