【摘 要】
:
在处理混合型大数据时,已有孤立点检测算法往往存在时间代价大、适用性差等问题.为了解决这一问题,本文基于最近邻思想提出了一个混合数据孤立点检测算法.该算法依据邻域计数
【机 构】
:
山西大学计算机与信息技术学院,太原,030006山西大学计算机与信息技术学院,太原030006;计算智能与中文信息处理教育部重点实验室,太原030006;
论文部分内容阅读
在处理混合型大数据时,已有孤立点检测算法往往存在时间代价大、适用性差等问题.为了解决这一问题,本文基于最近邻思想提出了一个混合数据孤立点检测算法.该算法依据邻域计数的思想给出混合数据对象之间的相异性度量,并基于最近邻定义了对象的孤立度,进而设计出一个混合数据孤立点检测算法,并且基于MapReduce编程模型对该算法进行了并行化设计以进一步提高算法执行效率.最后,在UCI数据集上通过与已有算法比较实验结果表明,本文提出的混合数据孤立点检测算法能有效地检测出孤立点,具有参数少、检测精度高的优点;算法的并行化实现提高了算法对混合型大数据的孤立点检测效率.
其他文献
近年来社会经济得到飞速发展,道路桥梁事业也得到了极大的发展,其对桥梁功能的要求也逐渐升高,使得桥梁的质量日益变成人们关注的焦点.而道路桥梁质量的提升不仅依靠施工技术
达邦生产的发酵豆粕有一个水产饲料非常看重的特性,即它的粘性,这也正是其与国内许多产品的差异性之一。同时,有特点的产品,增加了达邦客户的粘度。
本文探讨了建设工程安全监督管理的概念,在此基础上对工程质量安全监督管理的现状及管理建议进行了探讨与分析,旨在为建设工程安全监督管理行业的发展提供借鉴.
近年来,我国建设工程项目的开展可谓如火如荼,大量的建筑在各个地区相继出现.招投标工作是建设工程中的重要环节,与建设工程的开展顺利与否、工程质量等,都有着密切的关联.而