基于分布和逆文本类别指数的特征迁移加权算法

来源 :计算机应用 | 被引量 : 23次 | 上传用户:namedmat123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统机器学习面临一个难题,即当训练数据与测试数据不再服从相同分布时,由训练集得到的分类器无法对测试集文本准确分类。针对该问题,根据迁移学习原理,在源领域和目标领域的交集特征中,依据改进的特征分布相似度进行特征加权;在非交集特征中,引入语义近似度和新提出的逆文本类别指数(TF-ICF),对特征在源领域内进行加权计算,充分利用大量已标记的源领域数据和少量已标记的目标领域数据获得所需特征,以便快速构建分类器。在文本数据集20Newsgroups和非文本数据集UCI中的实验结果表明,基于分布和逆文本类别指数
其他文献
OpenFlow的出现提高了现有网络的服务质量(QoS),但在处理海量数据时存在网络会话识别效率低、网络报文转发路径不佳等缺点。在OpenFlow的研究基础上,提出了海量网络数据处理(GOMDI)模型,通过将GPU并行计算、生物序列算法和机器学习方法相融合,设计出GOMDI网络会话匹配算法和路径选择算法。实验结果表明,GOMDI网络会话匹配算法与CPU环境相比加速比提升了近300;路径选择算法中网
邓小平理论是随着实践的发展而丰富和发展的。党的第三代中央领导集体集中了党和人民的智慧,不仅提出了邓小平理论的科学概念,阐明了其历史地位,对其科学体系作了系统的概括,而且围绕着全面的制度创新,进一步丰富和发展了邓小平理论,形成了在社会主义市场经济体制下全面建设社会主义现代化的比较系统的理论和思路
<正> 问:您对小林善纪的《台湾论》及许文龙关于&#39;慰安妇&#39;的言论有何评论? 答:最近,日本右翼人物小林善纪以漫画形式发表《台湾论》一书,美化日本对台湾的殖民主义统
碳酸锂治疗甲状腺机能亢进1例马建芳,罗芳,陈文墉(中国人民解放军第476医院福州350002)患者谢某,男性,46岁,工人,住院号:51827。因怕热多汗,多食善饥,焦虑烦躁4月,于1994年6月21日入院。入院查体:体温36.3℃,脉搏92次/mi...
本文报道道茶碱与苯巴比(PB),苯妥英(DPH),卡马西平(CBZ)两类(4种)不同药物血浓度的HPLC同时测定法。采用国产色谱柱YWGC18(4.6&#215;250mm),检测波长为254nm,流动相为甲醇-水(50:50,V/V),流速:1ml/min,以4-氨基安替匹林作内标,各药物的平均回收率分别
《全国人民代表大会常务委员会关于修改【中华人民共和国婚姻法】的决定》已由中华人民共和国第九届全国人民代表大会常务委员会第二十一次会议于2001年4月28日通过,现予公布
期刊
国务院关于决定核准《中华人民共和国政府和大韩民国政府渔业协定》及其《谅解备忘录》的批复国函〔2001〕45号外交部: 国务院决定核准2000年8月3日在北京签署的《中华人民共
期刊
2013年全国开放式分布与并行计算学术年会(会议编号:CCF-TC-13-11)将于2013年8月16—18日在云南昆明召开,学术年会旨在为开放式分布与并行计算技术、开放系统技术、开放式网络技术与应用、开放系统安全与服务质量保障技术及相关
针对多输入多输出OFDM系统提出了一种简单灵活的空时分组码与多维特征波束形成组合方案,以充分利用MIMO信道的二阶统计信息。该方案在保证空时编码分集度的同时能最大化系统
本文认为 ,邓小平理论对马克思主义的继承 ,首先是对马克思世界观的本质即他的方法的继承 ;其对马克思主义的发展 ,是以时代的需要和中国特色的社会主义的实践为基础得出马克思主义的新观点。围绕这个中心 ,文章认为 ,马克思主义的历史阶段和理论形态既有联系又有区别 ,划分的标准是时代的特点。邓小平理论对马克思主义的继承和发展 ,依据的是马克思主义在我们时代具有不可超越的一般本质和由时代特点所决定的可超越的特殊本质。时代发展主题的转换和社会主义国家发展主题的转换 ,构成邓小平理论时代意义的全部内涵。邓小平理论作