增量聚类相关论文
近年来,区块链的概念逐渐进入公众的视野,比特币作为第一种基于区块链技术的数字货币也因此受到了广泛的关注。比特币和常规货币一......
在信息系统与物理系统深度融合的工业4.0背景下,急需改革的制造业享受着数据信息带来的便利,基于大数据与传统车间衍生的智能制造......
在信息技术日益发展的当下,挖掘网络之中的各种社区组织形式越来越被更多人重视。在某一特定网络中由一组连接较为紧密的顶点构成......
随着移动互联网与传感器技术的日趋成熟,人们对实时位置数据的获取更加便捷,由此移动对象轨迹数据的获取变得越来越容易,从而积累......
社交网络的兴起和发展带给人们生活极大的便利和变化。社交网络网站一般拥有百万以上的注册用户,全球范围内著名的社交网络网站有......
相对于Web上的海量数据而言,个人阅读和理解信息的能力非常有限,很难获得他们所期望的知识,此即“信息爆炸”问题。为了解决这个问题,......
Web2.0时代出现的论坛、博客、新闻和在线评论等新媒体每天产生海量文档信息,因此需要一种高效的方法提取文档重要内容,去除冗余信......
在计算机图形学的研究领域,三维网格模型分割技术和检索技术已经成为近年研究的热门课题。随着三维扫描技术的发展和三维造型技术......
随着计算机科学技术的迅速发展以及人工智能技术的兴起,模式识别得到越来越广泛的应用。人们在进行模式识别时,通常需要采集数量巨......
人们的生活包含着各式各样的数据,许多数据中都含有很重要的信息。数据挖掘就是从海量数据中提取重要信息的一种技术。作为数据挖......
在大数据时代背景下,电子商务、第三方支付等线上业务爆发式增长,随之而来的是日益猖獗的线上欺诈案件,在线欺诈检测技术作为企业......
区块链技术目前在金融、医疗、工业等多种领域均有所应用。公有链作为应用最成熟、最广泛的区块链,近年来其交易数据量也迅速增长......
在移动互联网浪潮的推动下,微博微信等社交新媒体平台的兴起,使得网络信息传播迅猛。对话题传播规律的研究有助于帮助人们了解周围......
近年来,随着科学技术的飞速发展,数据量的不断膨胀,如何有效地分析这些海量数据已经成为了目前研究的热点和难点。聚类分析方法发......
现今恶意代码数量呈指数趋势大量增长。利用机器学习、数据管理等手段建立自动化流水线式的恶意代码分析系统来完成对大量未知程序......
现实生活中的很多真实系统都可以看作是复杂网络的一种拓扑抽象,如科学家合作网、生物动态分子网络、通信网络等。研究表明,社区结......
近年来网络威胁加剧,每天新增恶意代码已达37万,并仍在上涨,传统的恶意代码检测系统静态检测准确率、效率有待提高,导致大量样本需......
随着数据的大规模增长,对于社团检测算法的研究日益成为复杂网络学科中的一个热点和挑战。在网络中检测社团可以分析网络结构,了解......
学位
社交媒体是拥有众多用户参与的新型在线媒体,近年来以推特为代表的社交媒体网站吸引了数以亿计的用户,现实社会中所发生的重大突发......
模糊C均值算法(Fuzzy C-Means clustering,FCM)是模糊聚类研究中的代表算法,该算法简单、高效,但是对噪声数据较为敏感。模糊C有序......
在电子商务推荐系统、社交网络分析、生物医药等领域普遍存在重叠聚类问题。每天都在海量增加的增数据使得数据间的关系变得更复杂......
网络的高速发展在给人们的生活和通信带来极大便利的同时,也产生了日益严重的安全问题。入侵检测技术是网络安全领域的一个重要研......
农业生产在我国发展的历史上一直扮演着重要角色,身处当今互联网时代也不例外。随着互联网时代的到来对各行各业都有不同程度的影......
我国是轮毂制造大国,而轮毂行业是典型的高耗能行业,能耗成本占据产品成本的比重不可忽视。随着市场竞争的日益激烈和工业智能自动......
互联网和移动互联网的快速发展促使全球数据量爆炸式地增长,Web已经成为各领域最具潜力和价值的巨大信息来源。Web网页中除了用户......
为有效处理动态增长的数据集,获得增量数据的聚类结果,文中利用高斯混合模型模拟数据分布,将原有样本所属高斯成分的均值和先验概......
随着互联网以及通讯技术的飞速发展,以互联网为基础的新型舆情传播媒体逐渐代替传统媒体,成为人们获取与传播舆情信息的主体。由于......
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生......
大多序列模式挖掘算法在处理呈指数增长的模式时性能有限,而且当输入的数据集很大时,因为主存限制将使其变成不可解的.本文提出基......
针对传统微博话题发现算法中,计算文本距离时仅仅考虑词与词的距离和最小而产生的问题,提出了使用CWMD(cos-word movers distance)......
针对传统聚类方法存在的不足,提出了一种基于自适应膨胀因子的聚类新方法(CAIF).相对于现有的一些聚类方法,CAIF方法不需要用户确......
针对现有的增量聚类算法对参数敏感度较高、时空复杂度较高等问题,提出了一种基于代表点的增量聚类算法。首先采用代表点聚类算法......
聚类分析要求较高聚类质量和快速响应能力,各行业数据仓库中的大量、高维数据对算法的效率提出了更大的挑战.CURE算法能够提供高质......
为了提高系统性能以及克服移动计算环境自身的通信带宽窄、网络断接等缺陷,采用语义缓存技术来管理相关数据就显得尤为重要。形式......
针对传统K-means聚类算法对初始中心点比较敏感、易陷入局部最优,首先提出基于KD-树的初始聚类中心点选取方法。该方法通过建立KD-......
针对具有增量特性的射频识别(RFID)轨迹数据的挖掘进行了研究,提出了轨迹聚类算法TP—mine。该算法将每个新的轨迹简化成一个有向线性......
话题发现是网络社交平台上进行热点话题预测的一个重要研究问题。针对已有话题发现算法大多基于传统余弦相似度衡量文本数据间的相......
海量和高维大数据集的聚类对计算机性能提出了很高的要求.基于具有层次聚类特性的RSOM树方法提供了一种有效的手段以实现对高维大数......
数据流离群检测因内存容量限制和实时检测需求而成为离群检测的一个难点。介绍了一种快速混合属性数据流离群检测算法。在衰减模型......
遥感技术的发展,使人类能够获得非常丰富的知识,扩大人们观察大自然的视野。但面临的问题是如何处理大量的数据,使之成为有用的信......
针对批量钻削工序质量检测问题,采用声发射传感器采集工序加工过程中的声发射信号,提取其时域统计特征,构造工序过程信号的特征向......
数据仓库为数据挖掘提供了很好的平台,当数据仓库中的数据发生变化时,原来挖掘出来的模式也要相应地进行更新。Martin Ester等最先提......
提出一种基于扩展凝聚点和网格的快速聚类算法CECPG(clustering using extended condensation point and grid).在CECPG算法的基础上......
传统的聚类分析方法一般都没有考虑大容量数据集合的问题,而数据挖掘技术的研究重点之一就是如何从海量数据中高效率地获取知识。结......
搜索引擎中关于人名的相关文档往往数据量庞大,且数据为增量式更新过程,新文档出现的时间与规模都存在不确定性。现有的方法多为全局......
以聚类技术为手段,对运动员跑动类型进行挖掘分析,主要工作包括:针对实际跑动动态的特点,提出动态增量聚类算法应用在训练跑动能力......
为有效地保护版权,提高大规模视频集的拷贝检测速度,提出一种完全实现在GPU上的基于增量式聚类的拷贝检测方法.对数据库中新增加的......
为了提高测试效率,需要筛选出高质量的测试用例,传统聚类算法在计算时会产生误差,易产生多个簇,导致聚类效果不佳。结合测试用例的......