【摘 要】
:
SNP(Single-Nucleotide Polymorphism,单核苷酸多态)是一种新的遗传标记。它在人类遗传变异中非常普遍,几乎占到已知变异多态性的90%以上。对SNP研究是后基因时代生物信息学研究
论文部分内容阅读
SNP(Single-Nucleotide Polymorphism,单核苷酸多态)是一种新的遗传标记。它在人类遗传变异中非常普遍,几乎占到已知变异多态性的90%以上。对SNP研究是后基因时代生物信息学研究的重要领域之一。然而,由于SNP大量存在于人类基因组中,并且存在大量多余的及与疾病不相关的SNP,使得寻找与疾病相关的SNP成为一个难点。通常解决这类问题的办法是进行特征选择。特征选择自从上世纪70年代以来得到了长足的发展,有许多特征选择的方法可用于一般性问题。本文应用特征选择来试图找出与疾病相关的SNP。
论文利用互信息作为特征选择的评价函数,提出了一种基于互信息频度的启发式搜索候选特征集的方法(枝条矩阵搜索算法),对SNP进行特征选择实验,并对算法及实验结果进行详细的分析。之后做了两组对比实验,第一组实验对ME算法和mRMR算法进行了仿真,并比较了这两种算法和本文算法的性能;第二组实验针对model内SNP之间的影响以及model间SNP的影响。
其他文献
光的空间巨并行性使得光学计算能拥有很高的数据宽度,依据最新研究成果——降值设计理论[2],三百位量级三值逻辑光学运算器模型已经研制成功。因此,如何管理三值光计算机高数据
在国内外,基于计算机视觉技术的影像测量系统已经得到了深入的研究,受到了越来越多的重视。目前,工业领域中对微小尺寸零件的检测精度和检测速度等要求越来越高,传统检测方法
本文提出了基于LUT的FPGA的时序分析方法和后仿真的设计方案,并予以实现。时序分析和后仿真是在布局布线基础之上进行的,是FPGA支持软件系统不可缺少的两个步骤。在时序分析
近年来,随着语音识别理论研究的深入和数字信号处理软、硬件技术的发展,语音识别技术的研究越来越受到人们的关注。另外,嵌入式技术的发展,使嵌入式语音识别技术成为语音识别
本文基于计算机技术和生物学原理,以蛋白质序列中蕴含的生物信息分类为依据,对蛋白质中α类、β类、α+β类及α/β类中样本数量较多的27类折叠子类型进行识别研究,提出了一种基
低密度校验(LDPC)码是一类逼近香农限的编码,已成为当今信道编码领域的研究热点之一。利用组合设计构造的一些LDPC码具有循环或准循环结构,不仅性能接近随机构造的最优LDPC码
随着信息技术的发展和后PC时代的到来,嵌入式产品成为当今IT产业的重要需求之一,同时巨大的嵌入式应用也对嵌入式设备提出了更高的要求,用户也出原要求“能用”转变为用得舒适,便
传统的色彩校正技术基于ICC规范,使用基于三刺激值的色度色彩空间,这使得色彩匹配往往是同色异谱匹配,仅能在同一观察条件下实现色彩的一致再现,若观察环境改变则颜色不再匹
小波分析已经广泛应用于信号处理与分析中,并取得了较为突出的效果。但在高维情况下,小波分析并不能充分利用数据对象的几何特征。针对小波理论的这一局限,人们在小波理论的
进化计算是一种模拟生物进化过程与机制求解问题的自适应人工智能技术,是一类随机搜索技术。它们模拟由个体组成的群体的学习过程,其中每个个体表示给定问题搜索空间的一点。