生物信息学研究的三个方面——从对生物学实验研究的技术支持、数据分析到对高通量数据整合的算法研究

来源 :中国科学院生物物理研究所 | 被引量 : 0次 | 上传用户:q51525779
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在攻读博士学位期间,笔者主要在如下三个方面从事了一些生物信息学的研究工作,包括对实验生物学的生物信息学技术支持、数据分析以及应用聚类方法在高通量数据的整合分析方面进行了探索。   基于合作单位在单分子操纵和纳米PCR扩增技术方面的实验进展,笔者提出了一种在单分子水平上的有序化单分子纳米测序策略。在这个合作项目中,笔者负责对实验生物学提供生物信息学的技术支持,在数据提取、实验设计和数据分析等方面做出了自己的贡献。正在通过分子手术的方法,即应用纳米克隆、纳米测序和纳米操纵技术展开攻关,希望解决与重复序列紧密相关的复杂基因组的序列间隙问题。   第三章是关于中华民族Y染色体非重组区域单核苷酸多态性的研究工作。本组实验数据中发现了新的祖先家系单体型亚组haplogroupO*,由此笔者对之前研究中提出的中华民族南方起源假说提出了质疑;并以本研究结果,推测性地提出了西部/北部起源的猜想。嵌套分支分析方法(nestedcladisticanalysis)进一步揭示了一幅更为详尽的多层次,多方向、持续性的民族融合历史画卷,这一民族融合的过程也就是中华民族形成和发展的过程。本研究为中华民族的演化和迁徙的研究提供了一些新的线索,一些相应的推断也与历史资料的记载相吻合。   第四章在多数据源的整合方面进行了一些探索,试图通过一个简单但十分有效的层次聚类算法来实现这个目标。本方法可以有效的揭示酵母高通量蛋白相互作用网络中的模块化结构,并通过进一步整合相关的亚细胞定位组数据及表达谱数据区分蛋白复合物和蛋白功能模块。进而根据功能模块中蛋白功能一致性的特征,笔者可以为在定义的功能模块中对尚未被注释的蛋白提供相对可信赖的功能预测。另一方面,对各种蛋白之间相关信息的整合可以使我们的方法对高通量数据的假阳性具有更高的鲁棒性。更为重要的是,这种简单方法能够很自然地被扩展到处理其它类型的数据融合问题,为研究生物网络及其它复杂网络的更为广阔的特性提供了一个理论框架。  
其他文献
本文通过对荣华二采区10
期刊
  船舶电力系统,由于工作环境恶劣,故障情况相对会有所增加。短路故障和非正常运行状态会使电力系统的安全可靠性受到威胁,缩短用电设备的使用年限,严重情况下会导致设备的损坏
能源危机与环境污染正日益威胁着人类的生存和发展。太阳能光伏并网系统有利于缓解能源危机、减少环境污染,正被全世界广泛应用。大规模光伏电站在向电网注入电力的同时,也附带
期刊
本文通过对荣华二采区10
期刊
人是生命演化的产物。然而由于具有一个超级大的大脑和高级的认知能力,人类在自然界中又显得十分与众不同。在灵长类进化过程中,脑容量大小和认知能力高低可以明显的分成几个等
本文将胡杨Na+/H+逆向转运蛋白同源基因PeNhaD1转入到酿酒酵母及大肠杆菌中进行表达,以研究其结构、功能及细胞定位。将PeNhaD1构建到酵母表达载体pYES2.0上,转入盐敏感的酵
资源冷杉(Abies beshanzuensis vat.ziyuanensis(L.K.Fu et S.L.M0.L.K.Fu etNan Li)是国家一级保护植物,为中国特有。生物学因素、人为破坏和环境变迁使得资源冷杉的生存受到
本文通过对荣华二采区10
期刊
电力系统无功运行优化能有效降低网络损耗,改善电压质量,是保证电网经济、安全运行的重要措施。现有国内电网规程和大多数研究文献对无功/电压控制设备日动作次数较为严格的限