微阵列数据相关论文
基因选择是微阵列数据研究中的重要课题。从充满冗余信息和噪声的高维小样本的数据中选择与样本分类最相关的基因,有利于提高分类器......
DNA微阵列技术推动生物信息学跨入了多基因、全基因组研究的崭新时代,同时也产生了远远超出传统数据分析方法处理能力的海量基因表......
在最近的二十年里,电子格式存贮的数据以惊人的速度激增,形成了海量的数据和信息。数据挖掘是从大型数据库或数据仓库中发现并提取隐......
眼下,机器学习、数据挖掘等技术已经普遍运用于医疗、生命科学、经济学等社会各行各业。 本文的主要内容是机器学习方法在生物数......
DNA微阵列数据广泛应用于生物医学,特别是癌症方面的研究。它是典型的高维小样本数据,具有高维,高冗余,高噪声的特点,许多经典的处理算......
纠错输出编码(ECOC)是一种多类分类的集成学习方法框架,比单个分类器具有更好的分类效果。ECOC算法的研究至今仅有二十年时间,但已......
DNA微阵列技术推动生物信息学跨入了多基因、全基因组研究的崭新时代,同时也产生了远远超出传统数据分析方法处理能力的海量基因表......
医学研究表明约30%的扩张型心肌病与遗传因素有关,因此从基因水平寻找其病因及发病机制越来越引起国内外学者的重视.采用针对超高维......
稀疏回归模型具有在高维数据上预测和估计未知参数的优点,因此在统计学、机器学习、生物信息学等领域引起了广泛的关注.然而将其应......
随着基因芯片技术的发展,基因表达实验获得了大量的微阵列相关数据,为人类疾病研究提供了一种全新的手段.然而,由于微阵列数据存在......
微阵列数据中的缺失值会对随后的数据分析造成影响.因此,正确地估计这些缺失值是很必要的.将一个k值选取算法结合到有序的局部最小......
针对现有的微阵列数据集成分类方法分类精度不高这一问题,提出了一种Bagging-PCA-SVM方法。该方法首先采用Bootstrap技术对训练样......
为了得到低冗余度高识别率的基因子集,提出了一种耦合基因灵敏度信息的微粒群优化基因选择方法。首先,通过单隐层神经网络从微阵列......
微阵列技术的出现使得从不同角度对生物体的多个参量同时进行研究成为可能。然而,微阵列数据样本小、维数高、非线性的特征成为实......
在总结二分类支持向量机应用的基础上,提出了利用卜验证方法和Wilcoxon验证方法进行特征选取,以支持向量机(SVM)为分类器,针对基因微阵......
传统的快速聚类算法大多基于模糊C均值算(Fuzzy C-means,FCM),而FCM对初始聚类中心敏感,对噪音数据敏感并且容易收敛到局部极小值,因而聚......
提出了基于二进制编码的量子行为粒子群优化算法(BQPSO)的癌症特征基因选择方法,利用BQPSO对样本数据进行特征选择。使用选出的特征......
DNA微阵列数据通常含有成千上万个基因,其中含有大量与分类无关的基因和冗余基因,这些基因的存在会严重影响分类精度和效率.针对这......
目的:研究大规模数据中的密度、无效分布和错误发现率的经验贝叶斯估计和应用。方法:对2个微阵列数据的贝叶斯模型,采用Poisson回归......
目的基因组尺度的代谢网络重构提供了一种从系统层面深入观察生物体的方法,由此重构得到的网络是个体的“全基因组网络”。鉴于这种......
构造高精度分类模型是对基因表达谱数据分析的主要研究方向之一,但提取不同特征空间产生的分类效果有很大差异,而集成分类系统在一......
微阵列基因数据用以挖掘特定的生物信息,聚类分析对于研究基因功能和基因调控机制有重要意义.结合改进的遗传算法对基因微阵列数据......
本文提出针对肿瘤微阵列数据的小波模极大值特征提取方法。首先求两类数据的Bhattacharyya距离分布,初步提取特征基因;接着进行小......
为解决微阵列数据中因样本量少且每个样本的维度高而带有大量干扰信息和冗余信息的问题,通过分阶段的步骤对特征基因集进行全方位......
用主成分分析(PCA)方法处理基因表达微阵列数据能够实现基因选择、基因表达模式提取、基因分类等,有其独特的优点。然而,PCA方法却存在......
基因芯片技术是基因组学中的重要研究工具。而基因芯片数据(微阵列数据)往往是高维的,使得降维成为微阵列数据分析中的一个必要步骤。......
提出了一种结合流形学习方法与分类算法的基因微阵列数据分类模型,先用流形学习算法对基因微阵列数据进行降维处理,然后再对降维后的......
鉴于DNA微阵列数据中无关基因和冗余基因对分类精度和效率的影响,提出一种基于全局和声搜索的特征基因选择方法,首先采用ReliefF算......
针对微阵列芯片数据采集量大、获取成本高的问题,提出一种新的基于灰值区间的微阵列模拟数据生成算法.该算法通过灰值度量的方式模......
微阵列数据广泛而成功地应用于生物医学的癌症分类研究.一个典型的微阵列数据集包含大量(通常成千上万,甚至数十万)的基因、相对少量(往......
随着现代生物技术的发展,基于基因表达数据的肿瘤分型诊断已成为DNA微阵列的重要应用领域。提出一种基于基因表达数据的肿瘤分型诊......
【提要】目的从统计理论角度探讨基因集分析方法,初步建立微阵列数据基因集统计分析理论框架。方法采用计算机模拟技术,比较不同原假......
复杂数据主要表现在相依、非线性、维数高与不完全观测等,在股市、基因序列和经济等领域中经常出现。为解决巨型数据集合问题,数据挖......
Background knowledge is important for data mining, especially in complicated situation. Ontological engineering is the s......
在生物信息学领域,挖掘和人类疾病相关的基因是一个非常重要的研究课题。它对于理解疾病的机制和发现新的药物靶标而言都是非常重......
近年来,应用DNA微阵列技术对疾病,尤其是癌症进行诊断,已逐渐成为生物信息学领域的研究热点之一。对比其它的数据载体,微阵列数据......
研究微阵列数据中挖掘Top—k频繁闭合项集问题,并设计挖掘算法ZDtoP。算法采用ZBDD结构压缩存储数据集,使用自顶向下深度优先搜索策......
目的比较六种差异基因筛选方法的使用效果及适用性。方法用Monte-Carlo方法产生不同类型的模拟数据,分别用不同的方法计算、评价其......
因为由主分量分析与形状分析相结合的基因选择方法没有有效利用样本的类别信息,所以提出了一种新的基因选择方法,将间隔最大化判别......
现有大部分微阵列数据中频繁闭合项集的挖掘需要事先给定最小支持度,但在实际应用中该最小支持度很难确定。针对该问题,提出top-k频......
微阵列技术能够同时测量数千个基因的表达水平值,产生大量的微阵列数据集,导致需要研究更加有效的分析算法来挖掘其中的生物模式。......
随着大数据时代的到来,机器学习和数据挖掘技术正面临着前所未有的机遇和挑战。作为机器学习最核心的研究领域之一,分类问题受到了......
从三维微阵列数据集挖掘出的三维聚类,能够分辨出与某些表现型(如疾病)相关的样本,而且能找出与这些表现型相关的候选基因.当挖掘3D微阵......
微阵列(microarray)技术用含有DNA或者蛋白质序列的微小玻璃芯片取代了传统生物医学中的凝胶、滤器和纯化柱,使科学家们能够在基因组......
微阵列技术的发展给生物科学研究带来了革命性的契机,成千上万的基因(或蛋白等)的同时测定成为现实,这很快产生了庞大的微阵列数据。......
特征选择算法是微阵列数据分析的重要工具,特征选择算法的分类性能和稳定性对微阵列数据分析至关重要。为了提高特征选择算法的分......