【摘 要】
:
文本数据流中概念的频繁漂移导致有效信息不足,从而使得漂移检测和数据流分类准确率下降。针对该问题,引入潜在狄利克雷分布模型并考虑文本数据流隐含的语义信息,提出一种新
【基金项目】
:
国家重点研发计划项目(2016YFC0801406),国家自然科学基金(61503112,61673152).
论文部分内容阅读
文本数据流中概念的频繁漂移导致有效信息不足,从而使得漂移检测和数据流分类准确率下降。针对该问题,引入潜在狄利克雷分布模型并考虑文本数据流隐含的语义信息,提出一种新的概念漂移检测算法。计算相邻模块中词和主题特征空间的语义相似度,其中主题的相似度根据主题-单词概率分布进行评估,当2个特征空间相似度都较低时判断为发生概念漂移。实验结果表明,与DDM、CDRDT、DWCDS、HDDM-W-Test和REDLLA算法相比,该算法对文本数据流中概念漂移的检测性能均有所提升,尤其在概念频繁漂移时可以显著减少漏检数量。
其他文献
7月13日下午,“信阳市共青团助力脱贫攻坚——2016希望工程圆梦大学行动”新闻发布会在信阳市行政审批中心六号楼召开。
黄柏山是国家级森林公园,地处大别山北麓,是灌河的发源地,长江和淮河的分水岭,物种多样,植被丰厚,山色随四季变化,有无穷遐想之美。
目的探讨分析人性化全过程护理模式应用于纤支镜检查过程中的效果。方法择选50例行纤支镜检查患者,随机分为常规组(n=25)和人性化组(n=25),常规组予以常规护理,人性化组予以
“领导你们工作那么忙,咋又来看我了,快,快进屋来坐。前段时间孩子上大学的助学贷款村里已经帮忙申请下来了”叶县仙台镇阁老吴村村民朱玉坡高兴的说道。
8月19日上午,李磊、杨树朋骨灰安葬活动仪式在许昌市烈士陵园举行。在团许昌市委组织倡导下,270余名青年志愿者们怀着悲痛的心情送完烈士最后一程。
红麻是一年生多用途天然纤维作物。从红麻不育系的类型、不育系的选育和不育的机理研究等方面进行了综述,并讨论了红麻不育系的利用、不育机理的研究方向和思路。
4月4日,在河南郏县冢头镇花卉种植基地,花卉种植专业户正在培植造型树。近年来,该镇积极引导农户大力发展规模化种植,截止目前该镇已种植桂花、桔子、红梅等几十个优质品种,每年嫁
以转Bt基因棉和常规棉为材料,通过室内测定,研究了以转Bt基因棉为食的扶桑绵粉蚧(Phenacoccus solenopsis)对异色瓢虫(Harmonia axyridis)成虫功能反应的影响。结果表明,异色瓢虫