基于聚类分析的不均衡数据标注技术研究

来源 :计算机仿真 | 被引量 : 3次 | 上传用户:anysome_921
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布不均衡的数据在通过传统聚类分析的方式进行标注时,聚类效果容易偏向于样本数多的类,从而造成标注出现误差的问题。针对此问题提出改进的含有均衡约束聚类算法的标注方法,对不均衡数据的聚类标注准确率实现了比较有效的提高,方法包含数据初始聚类、专家知识调整,数据均衡化处理,含均衡约束聚类等步骤。通过初始聚类对不均衡数据进行初始类标签分配,专家知识调整对部分数据错误标注进行标签调整修改,对数据进行均衡化处理得到均衡数据集,通过均衡约束聚类对均衡数据进行标签最终精确分配。经仿真验证表明,上述方法比较有效的提高了
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
对钢筋混凝土工业厂房柱的破损即钢筋锈蚀和混凝土损伤机理进行了阐述,并提出相应的防护措施及加固方法.
目的:分析听神经瘤患者脑干听觉诱发电位(BAEP)的改变及特点.方法:对40例听神经瘤患者(80耳)进行BAEP检测,测定Ⅰ、Ⅲ、Ⅴ各波潜伏期(PL)、峰间潜伏期(IPL)、双耳间PL或IPL之
结合石家庄钢铁公司连轧工程的实例,较全面地介绍了钢渣桩复合地基技术,分析了使用该技术产生的经济和社会效益.
目的:以虫草素(化合物A)为母核合成新化合物5'-呋喃甲酰酯-3'-脱氧腺苷(化合物B),并且进一步通过化合物B修饰纳米金得到了络合物C,研究二者体外抗肿瘤活性及抑菌活性