【摘 要】
:
本文的研究内容如下:(1)确定的聚类结果.(2)低的时间复杂度.本文的一个研究方向就是把大的数据集化整为零,尽可能地在小数据集上进行运算.其中,如何把不相关或相关性小的各数
论文部分内容阅读
本文的研究内容如下:(1)确定的聚类结果.(2)低的时间复杂度.本文的一个研究方向就是把大的数据集化整为零,尽可能地在小数据集上进行运算.其中,如何把不相关或相关性小的各数据集找出来,是研究的主要内容之一.(3)类别数尽可能少地受人的影响.本文提出了自生长树(SGT,self-growth tree)算法.该算法自顶向下地构建最终结果,树的生长也分为垂直和水平两个方向.在垂直方向,一个节点被分裂成若干子节点;在水平方向,非常相似的子节点被合并.此外,设置一些条件来提前停止树的生长以降低算法的时间复杂度也是该方法的一个特点.为了评价该算法的表现,本文在一个小规模的基因表达数据集上实现了该算法.同时,和等级聚类的结果比起来,该算法的分类结果显然较优;同K-means聚类结果相比,虽然没有明显的优势,但这是在K-means方法中的K根据先验知识已预先设定好的情况下进行的,可以推断,如果是在大规模数据集上比较两者的表现,SGT算法还是有优势的.
其他文献
本文实现了基于虹膜的计算机自动诊断系统中的虹膜定位、虹膜图谱覆盖、分区技术和根据病理柔性分区关键技术.首先,本文提出了一种针对东方人种虹膜的虹膜定位算法.该算法利
在当今社会里,信息的爆炸式增长已经成为人们必须面对的问题。借助计算机在海量信息中找到人们所需的有用信息的研究越来越受到人们的关注。本文回顾了信息检索技术的发展
利用目前商业PC硬件提供的现有性能与条件,选取与其相匹配的有较大优化可能性的且具有较广泛适用性的现存物理性动态模拟算法方案,对其进行有针对性的调整以适应其硬件结构,
特征子集选取在机器学习,数据挖掘和模式识别领域起着很重要的作用。OFFSS (Optimal Fuzzy-valued Feature Subset Selection)是一种新的模糊值特征选取的方法,是基于两类事
本课题在分析了现有的几个典型节能自组织协议的优点和不足之后提出了一个新的基于组簇机制的、节能的、移动自适应的分布式自组织协议MAESP。首先,对组簇机制中簇头
目前,扩张矩阵学习已成为归纳学习的一个重要的分支。而模糊扩张矩阵是在扩张矩阵基础上引入了模糊思想,使之能处理与人的思维和感觉有关的不确定性数据,因而得到了广泛的应
本文以信息率失真理论为基础研究了率失真函数在视频信源信道编码中的应用。首先,无线视频传输对编解码处理速度有较高的要求。为此我们提出一种快速帧间宏块划分模式判定
20世纪末,信息技术的飞速发展,极大改变着人们工作、生活的方式及质量。在保险业中,由于信息技术的采用,信息传递己从传统的纸质文件向电子文件转变,在企业的日常业务中,已基
随着Internet的迅猛发展和普及,远程教育、视频点播、视频会议等流媒体服务系统越来越受到人们的青睐,而由于用户量的剧增与Internet网络传输的突发性和尽力服务,迫切需要高吞吐
随着软件产业的迅速发展,软件系统的规模、数量以及复杂性与日俱增,使得软件系统的开发、测试和维护的重要性和难度也越来越大。将可视化技术应用到程序理解中将大大提高软件相