【摘 要】
:
宏基因组表示自然环境中全部微生物遗传物质的总和,是生物信息学最热门的研究领域之一。宏基因组学无需对微生物进行培养,直接提取环境中存在的所有微生物的遗传信息,进而研究环境中微生物之间的相互作用,分析微生物群落的物种多样性。随着分子生物学技术的快速发展,特别是下一代测序技术的出现,大量的宏基因组测序数据不断产生。面对海量的测序数据,如何利用它们对微生物组进行研究分析是生物信息学面临的一大挑战。近十年来
论文部分内容阅读
宏基因组表示自然环境中全部微生物遗传物质的总和,是生物信息学最热门的研究领域之一。宏基因组学无需对微生物进行培养,直接提取环境中存在的所有微生物的遗传信息,进而研究环境中微生物之间的相互作用,分析微生物群落的物种多样性。随着分子生物学技术的快速发展,特别是下一代测序技术的出现,大量的宏基因组测序数据不断产生。面对海量的测序数据,如何利用它们对微生物组进行研究分析是生物信息学面临的一大挑战。近十年来,受益于测序成本的大幅降低,分子生物学研究产生了大量的微生物群落时间序列数据。在时间序列相关的统计方法中,局部相似分析(local similarity analysis,LSA)已被广泛用于研究不同环境中微生物群落的时空演变,寻找微生物物种之间潜在的局部和时间延迟关系。这些关系无法通过传统的相关性分析方法获得。通常利用置换检验对局部相似分析的统计显著性进行评估。最近,研究人员提出了一个理论方法分析局部相似得分的统计显著性。然而,这个方法和置换检验都需要假设原始时间序列是独立同分布的,但在很多实际问题中这个假设可能是不成立的。本文提出了一些新方法研究平稳时间序列局部相似分析的统计显著性,并将其应用于生物时间序列数据中。论文主要包含以下几个方面:第二章提出了平稳时间序列局部相似分析的统计显著性评价方法——数据驱动局部相似分析(Data Driven LSA,DDLSA)。在DDLSA中,基于独立同分布理论评估方法,利用长期方差对局部相似分析的渐近理论进行了修正,得到了平稳时间序列局部相似得分的极限分布,其中的长期方差通过非参数核估计方法获得。另外,提出了一个基于残差的评价方法LSAres(LSA for residuals),通过独立同分布理论评价方法评估给定统计模型残差序列的统计显著性,得到原始序列局部相似分析的统计显著性。模拟结果表明,在平稳时间序列模型中,DDLSA和LSAres可以有效控制第一类错误率,而其他方法却不能。另外,将不同方法应用于人类和海洋微生物数据集中,发现我们的方法可以识别大多数可能的显著关系,并且有效减少假阳性关系的数量。第三章将滑动分块自助法应用于平稳时间序列局部相似分析的统计显著性评估中,提出了 MBBLSA(Moving Block Bootstrap LSA)方法。该方法首先将原始序列分为长度相同的可重叠的小块,然后对分块样本随机有放回抽样,最后拼接成与原始序列长度一样的重抽样样本。由于每个分块样本是平稳的,因此重抽样样本也会保留原始序列的部分平稳特征,从而克服了置换检验需要原始数据必须为独立同分布序列这一缺点。由于在滑动分块自助法中分块长度的选择对最终的结果起着至关重要的作用,因此需要找到一个合适的分块长度选择器。本文选择了一个基于AR(1)模型自回归系数的分块长度选择器。最后,将MBBLSA应用于模拟研究和实证分析中,结果表明,相比于现存的方法,MBBLSA的表现更好。第四章首先介绍了局部相似分析的扩展方法一一局部趋势分析(local trend analysis.LTA)。局部趋势分析首先将原始序列转化为趋势序列,然后对趋势序列进行局部相似分析,进而得到局部趋势得分。为了评估局部趋势得分的统计显著性,提出一个新的方法STLTA(Stationary Theoretical Local Trend Analysis)。利用矩阵的谱分解理论,得到了不同状态空间趋势序列的调整方差,从而可得局部趋势得分的精确极限分布。模拟结果显示,在不同的时间序列模型下,STLTA的第一类错误率更接近给定的显著性水平。将STLTA应用于不同的宏基因组数据中,与置换检验和独立同分布序列评价方法相比,发现STLTA更加有效。
其他文献
研究目的当前,人口老龄化程度不断加剧,老年人不仅对“养”有需求,对“医”的需求则更加迫切,而我国医养结合养老服务尚处于发展阶段,医养结合的目标还未充分实现。本研究从民办医养结合养老机构、机构入住老年人、政府政策执行部门三方入手对重庆市沙坪坝区民办医养结合养老机构服务现状进行调查,分析民办医养结合养老机构在医养结合服务过程中存在的困境,并探索完善医养结合养老服务的对策建议,满足老年人多层次的健康养老
目的:本研究旨在探讨HSCs外泌体源性circ WDR25对肝癌细胞侵袭增殖的作用及癌旁活化肝星状细胞(HSCs)与γδT淋巴细胞相互作用(二者比值)与肝细胞癌(HCC)根治性切除术后患者的预后关系。方法:肝星状细胞系LX-2分别与肝癌细胞系Hep3B、SMMC-7721、HCCLM3行transwell法共培养建立肿瘤活化的HSCs,基因芯片检测对比发现,circ WDR25显著上调,差异变化最
目的探讨心脏磁共振(cardiovascular magnetic resonance,CMR)和超声心动图在病毒性心肌炎和急性心肌梗死中的诊断价值。方法回顾性分析2015年7月至2020年3月在我院住院且资料齐全的病毒性心肌炎患者18例(心肌炎组),急性心肌梗死患者17例(心梗组),比较2组一般临床资料、实验室、心电图、超声心动图和CMR指标。结果心肌炎组年龄低于心梗组(P<0.05),发热及受
外泌体作为一种新型液体活检生物标志物,通过表面标志物和内容物介导细胞间通讯,参与细胞免疫调节、增殖、分化和凋亡等重要生物学过程,在肿瘤的发生、发展过程中发挥重要作用。目前的外泌体检测主要依赖于荧光分光光度法、流式细胞术、纳米粒子跟踪分析技术等,但这些技术普遍存在经济成本高、操作繁琐、需要专业检测人员等缺陷。因此,发展一种超灵敏、经济高效、免标记的外泌体精准检测新方法具有重要的临床意义。表面等离子体
目的:探讨Graves病合并肺动脉高压(pulmonary arterial hypertension,PAH)患者的临床特点及危险因素。方法:收集2013年1月至2019年7月于重庆医科大学附属第一医院内分泌科、核医学科确诊为Graves病的138例患者临床资料,对其进行回顾性分析。根据超声心动图结果将患者分为无PAH组和PAH组。应用SPSS 22.0软件进行统计分析,比较2组差异,分析其临床
目的:使用加强梯度回波T2*加权血管成像(ESWAN)测量并比较特发性震颤(ET)和健康受试者(HCs)脑深部灰质核团的铁含量,并评估其与震颤程度的关系。材料与方法:使用GE ESWAN序列对20位ET患者及30例健康对照进行扫描,并将相位图提取转换为QSM*图,再对受试者脑深部灰质的QSM*值进行测定并进行比较,以评估ET患者脑内深部灰质核团的铁沉积情况。结果:ET组与健康对照组深部灰质选定的感
目的基于卷积神经网络(convolutional neural network,CNN)的计算机辅助诊断技术有望提高临床诊断准确率。因此,本研究探讨基于多参数磁共振(magnetic resonance,MR)图像的预先训练好的CNN模型是否有助于鉴别较低级别胶质瘤和脑炎。方法数据集包含来自164名最终诊断为WHO Ⅱ-Ⅲ级胶质瘤(n=56)和脑炎(n=108)患者大脑MR图像,并分为训练集和测试
目的探讨膈肌功能与肺切除术后肺部并发症和近期预后的关系,分析导致膈肌功能障碍的危险因素。方法序贯收集于我院胸外科行单侧肺切除术的患者90例,分别于术前(T0)、术后24小时(T1)、48小时(T2)、72小时(T3)四个时间运用床旁超声监测双侧膈肌移动度(Diaphragmatic excursion,DE),根据术后膈肌移动度分为膈肌功能障碍组(Diaphragm dysfunction gro
背景:高磷血症是慢性肾脏病(Chronic Kidney Disease,CKD)患者,尤其是维持性透析患者最常见的并发症之一,与患者死亡率增加密切相关。PA21是一种新型含铁、不含钙的口服磷结合剂,通过与胃肠道内磷酸盐结合从而降低血磷。本系统评价和meta分析评估了PA21治疗维持性透析患者高磷血症的有效性和安全性,为临床用药提供循证依据。方法:通过计算机检索Pubmed、Embase、Coch
研究背景和研究目的内耳毛细胞是听觉的受体细胞,能够将机械刺激转化为电信号,对于维持听觉有着不可替代的作用。毛细胞表面的微绒毛样突起——听纤毛在机械能-电能的转换过程中发挥了至关重要的作用。听纤毛的根部嵌插在毛细胞的表皮板中。表皮板位于毛细胞胞质上表面,是由纤维肌动蛋白(F-actin)构成的一个电子致密结构,能够使听纤毛稳定地锚定在毛细胞上。听纤毛和表皮板的发育和维持对听觉传导有着非常重要的意义。