基于广义主成分分析的全基因组生物检测模型研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:lmx1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
广义主成分分析(Generalized principal component analysis,GPCA)是以主成分分析(Principal component analysis,PCA)为基础发展起来的,其思想与主成分分析相同,是用较少的指标代替多的指标来反映原来指标的信息.例如,有n个样品,每个样品测得p个指标,共有np个数据.由于指标之间往往互有影响,从p个指标中找出几个综合指标并对其进行分析,这样就可以使用小于p个指标去计算,却能得到p个指标计算出来的结果.从海量的单核苷酸多态性(Single nucleotide polymorphisms,SNPs)中,挑选出与疾病或某些临床、环境因素有关的位点,仍是全基因组关联分析中(Genomewide association study,GWAS)的一个重要的课题.本文针对表型-SNP构成的二维列联表结构,提出了一个GPCA模型,该模型是同时对所有SNPs建立的.具体就是对该模型的矩阵作奇异值分解(Singular value decomposition,SVD),来达到减少模型中参数的个数,因此该模型也可称Logistic SVD模型.另外,本文通过刻画SNP基因型在不同表型下的分布差异,构建了一个SNPs筛选准则.模拟研究显示,本文基于Logistic SVD模型和重新构建的SNPs筛选准则都优于现有的方法.
其他文献
10月15日,十师召开党的群众路线教育实践活动总结大会,对十师党的群众路线教育实践活动进行全面总结,对巩固发展教育实践活动的成果、建立长效机制进行部署。活动开展以来,十
在我国国内建筑业市场,招标投标已经成为市场运营中必不可少的一个环节,是建筑业市场的一个组成部分。招标投标最早起源于西方国家,在我国因时代发展的需要,国家政策法规的推
生菜是莴苣的一种,即叶用莴苣。因主要用于凉拌生食和作色拉的菜料而得名。原产于地中海沿岸,以叶和叶球供食,脆嫩清香,且含多种营养物质。种植生菜病虫害少,可以不用农药,称得上无
为了改善公路隧道围岩云分级系统中传统的数据管理方法,将MySQL数据库引入到云分级系统的设计中。该系统采用关系型数据库,运用E-R模型进行概念结构设计,具体描述了4个实体以
"以彼之道,还施彼身。"自章虚道人口中的一句话,使平日名不见经传的慕容世家从此声名鹊起。慕容一姓,是为东晋时五胡十六国之燕国鲜卑族的国姓。当年东晋偏安江南,鲜卑族趁机窃
目的:应用超声生物显微镜(UBM)检查与诊断虹膜睫状体囊肿并进行临床观察.方法:应用超声生物显微镜对不明原因眼痛、眼胀或眼部不适及高眼压患者行UBM进行横向及纵向扫描,对发现的