混合值差度量及其在MDS中的应用研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:zzqq1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多维尺度分析(Multidimensional Scaling,MDS)是一种传统的多元统计方法,自提出以后的数十年来,随着研究的不断深入,应用范围越来越广泛。目前,学界对MDS的应用研究仍旧处在一种非常活跃的状态。MDS已经被广泛应用于经济学、管理学、心理学、社会学、考古学、生物学、医药、化学、网络分析等众多不同领域之中,并取得了较好的经济效益和社会效益。在这方面,国外的研究走在前列。MDS的处理对象一般是一组对象之间的两两相似性度量,这种相似性度量通常以对象之间的距离为标准,选取合适的距离计算方法在比较大的程度上影响着MDS的处理效果,当对象采用混合类型的属性进行描述时更是如此。目前,MDS通常以欧氏距离(Euclidean Distance)为基础。然而由于欧氏距离具有与各指标的量纲有关、不考虑各指标间的相关性等特点,MDS的处理效果将会受到一定影响。尤其是,欧氏距离对名义属性并不是一种直接的处理方式。在处理名义属性时,欧氏度量方法通常先将名义属性值用数值进行代替,然后以数值型属性的处理方式进行处理,这就从根本上否定了名义属性的固有特点,从而造成信息丢失。另一方面,MDS分为度量性MDS(Metric MDS)和非度量性MDS(Non-metricMDS),其中前者用于定量处理,后者用于定性处理。由于非度量性MDS对对象间的相异(似)性与对象间的距离关系要求不算严格,只需满足单调的顺序等级关系,不需要定量地表示出来,因此,非度量性MDS对定序数据是比较有效的。而对于名义数据(Nominal Data),度量性MDS未必有效。考虑到度量性MDS是进行的定量分析,要比进行定性分析的非度量性MDS更能精确地揭示数据的内在结构,因此对一些内容完整、含名义类型数据的数据集,我们可以考虑在优化名义数据预处理效果的基础上,采用度量性MDS进行计算。因此,考虑到欧氏距离的局限性以及MDS本身的特点,我们在根据实际问题进行修改的基础上,采用了混合值差度量(Heterogeneous Value DifferenceMetric,HVDM)来进行数据的预处理,以提高MDS对名义数据计算精确度。在UCI的Abalone数据集上进行的实验表明,这种方法有比传统的数量化方法在重构能力、重构精确度方面都有更好的表现。现实世界中,对象的特点需要从多方面进行描述,所以含名义数据的混合类型属性对象距离的计算较为常见。因此,我们的工作将对此提供一定的支持。
其他文献
随着互联网的日益强大,互联网上数据急剧增多,如何在海量的数据中快速准确的找到所需信息,就显得尤为重要,这就需要多模式串匹配算法。同时越来越多的人使用互联网就会使互联
近几年来,人们对数据采集技术有了较大进步,并且对处理技术理解的不断深入,以及在军事、金融物流、GPS定位、雷达测速、传感器网络WSN、隐私保护、无线射频识别RFID等领域的具体
虚拟现实技术目前已经广泛的应用到人类生活的各个领域,其开发的虚拟系统不仅能够更加逼真的反映真实的空间环境,还提供了良好的人机交互操作能力。虚拟校园网就是虚拟技术在数
随着科技的发展,当今社会的不安全因素越来越多,人们对安防系统的需求也日益增多。门禁系统和视频监控系统作为安防系统的重要组成部分,目前各自的发展已趋向于成熟,如何提高产品
计算机技术的迅速发展给地理信息系统带来了巨大的变化,随着空间数据量和计算复杂性的增加,地理信息系统所采用的集中式模式面临着诸多挑战。P2P技术作为一种新的分布式计算
视频前后景分离与合成是信息化生活的基本需求。本文深入研究了视频前后景分离与合成相关理论与技术,充分分析了视频前后景分离与合成需要解决的问题,并基于此设计并实现了一个
访问控制是国际标准化组织ISO在网络安全标准(ISO7498-2)中定义的安全信息系统的基础架构中必须包含的五种安全服务之一,它是实现既定安全策略的系统安全技术,管理所有用户的资
近年来,游戏和电影行业的快速发展使人们对高质量真实感图形的需求不断增加。因此,如何更逼真、更高效地绘制三维场景是当前真实感图形学研究的热点。为了提高光线跟踪的绘制
伴随着计算机技术、网络技术和远程通信技术的不断发展,电子交易得到急剧发展,电子交易中的安全问题也日益备受关注,对网上电子交易的安全与便捷提出了更高的要求。本文针对安全
受限域问答系统是自动问答系统的一种,相对于开放域问答系统更具实用性和可行性而成为自然语言处理领域的研究热点。受限域问答系统通常包含三个部分:问句分析、信息检索和答案