几类复杂体系的分类及属性选择问题研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:ogl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生命科学技术的快速发展产生了大量的生物数据,形成了多种多样的复杂体系,如何从这些数据中发现有价值的知识及规律,成为目前理论与实践研究的热点与难点。为了快速且全面的处理如此多的生物数据,数据挖掘技术成了大部分研究者的首选,旨在利用数据挖掘的方法,在已有数据的基础之上发现相应的规律和知识进而指导与解释生物实验与生命现象,加速对生命本质特征的认识。分类是数据挖掘中重要的内容,也成为各学科研究的重点。朴素贝叶斯分类器是一种简单且高效的分类器,它是在贝叶斯定理的基础上,通过条件独立性假设,将计算消耗降低,预测未知数据样本,并且对高维数据分类有良好的表现。但朴素贝叶斯限制条件较强,影响其在现实应用中的分类性能。通常对朴素贝叶斯的改进一般从两方面进行,即属性间的依赖关系和分类器的整体技术。本文着眼于分类器整体技术和属性选择,提出了二次建模的加权朴素贝叶斯,结果表明该算法在相对较大的样本集中取得了较好的效果。属性选择作为一种数据预处理的技术,有着重要的意义。研究表明大部分数据集中存在的冗余和噪音数据严重影响了分类的效果,一般采取的方法是属性选择或属性提取。本文提出了基于ReliefF的打包算法,结合了过滤(Filter)属性选择与打包(Wrapper)属性选择的方法,其效果比单独使用其中的一种更好。经测试,通过与三个Filter方法和两个Wrapper方法比较,该算法体现了其优越性。
其他文献
制造业物联网的网络特性复杂多变,体现在制造业中存在有线、无线网络,各类传感器、驱动器、感知节点以及执行节点并存。其中感知节点随着制造业环境的不同而动态变化、信道可
随着移动互联网、自媒体、社交网络的快速发展,互联网出现了“信息过载”问题。作为搜索引擎之后一个革命性的技术,推荐系统以其能发现用户潜在需求、提高人们选择和筛选物品
随着计算机技术的高速发展,计算机与信号处理相结合的音频修复技术在音频修复与数字化保存产业得到逐步推广。我国数字化、信息化进程的不断推进,各类图书馆、博物馆和档案馆
随着互联网络的飞速发展,给网络系统的正常运行带来了一系列的问题,其中最突出的就是由于网络带宽资源没有得到有效管理导致网络性能降低。与此同时,网络中不同业务流对资源
近来,处理器设计、内存和无线通信技术的进步激发了研究者们对分布式传感网络的关注,在分布式传感网络中,由若干相互独立且具有自我维护能力的结点相互协作现实信息收集和实时处
随着计算机技术和网络技术的迅猛发展,信息系统不断朝着集成化、智能化、网络化与分布式的方向发展,传统MIS系统开发模式的缺陷逐渐暴露出来,限于开发周期和成本、人员调配上
随着信息科学技术的高速发展,人们对海量信息存储的需求日益增长。CPU的处理速度和存储设备I/O处理速度之间的差距越来越大,为了弥补这种处理速度的差异,在磁盘阵列中加入Cac
随着计算机技术和Internet的飞速发展,网络信息安全问题逐渐成为维护国家安全和社会稳定的一个焦点。入侵检测系统(Intrusion Detection System, IDS)应运而生,它通过对计算
随着微博类应用的风靡,用户在微博平台上产生的数据在每时每刻地快速增长,搜索引擎虽然能够根据用户输入的事件关键词从海量的数据中返回相关微博,但大量的微博数据,加之微博
随着互联网带宽的提高以及计算机信息处理能力的不断提升,多媒体信息本身所包含的海量的数据,使人们能够通过计算机处理多媒体中所包含的有用的信息。对视频信息的处理更是近