面向相似重复记录检测的特征优选方法

来源 :传感器与微系统 | 被引量 : 0次 | 上传用户:lianzi0118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据集相似重复记录检测和识别中,数据源组成复杂、表征数据记录的特征属性过多,因而检测精度不高、执行检测的代价过大。针对这些问题,提出了一种分组模糊聚类的特征优选方法。首先进行分组记录的属性处理,以有效降低记录属性的维数,并获得分组中的代表性记录,然后采用一种相似度比较计算方法进行组内相似重复记录的检测。理论分析和实验表明:该方法有较高的识别精度和检测效率,能较好地解决大数据集中相似重复记录的识别问题。
其他文献
研究了高灵敏度谐振式红外光声气体传感系统,对系统的谐振频谱进行了测试分析,观察到了新的谐振模式。经过对比,发现选用新的谐振模式具有更高的测试灵敏度和信噪比,新的谐振
针对在GNSS/INS深耦合接收机产品设计中INS器件的选用问题,仿真研究了不同动态条件下,导航级、战术级和商业级这3种不同性能级别的INS器件对GNSS/INS深耦合组合接收机跟踪环
利用通电螺线管与永磁铁之间的作用力,提出了一种测量电流的方法。光纤Bragg光栅(FBG)在永磁铁的牵引下发生轴向应变,引起Bragg中心波长的漂移,通过解调中心波长漂移量对电流进行测量。实验中采取多匝数螺线管和小电流来模拟大电流,对0~3 A的直流电流进行了测量。实验结果表明:中心波长漂移量与电流有很好的线性关系,线性度为0.9998,电流灵敏度约为0.97 nm/A。
为了满足高精度测量系统对高精密运动导轨的需求,通过结合通用运动自动控制器(UMAC)和直线电机的驱动方式,实现了"PID+速度/加速度前馈+陷波滤波器"控制算法对共轴双驱型导轨
在研究了多种降低系统功耗方法的基础上,针对无线传感网络的低功耗要求,对无线传感器网络各模块进行了分析和研究,设计并实现了一种基于算法移植的软件开发低功耗的方法,有效降低