论文部分内容阅读
蛋白质翻译后修饰是调节蛋白质生物学功能的关键步骤之一,几乎参与了细胞内所有的生命活动过程,并发挥着十分重要的调控作用。例如,磷酸化几乎涉及所有的生理及病理过程,如细胞信号转导、肿瘤发生、细胞的增殖、发育和分化;糖基化对蛋白的稳定性和可溶性起重要作用,同时影响细胞之间相互作用;泛素化对于细胞分化与凋亡、DNA修复和蛋白质降解等生理过程起重要作用。近年来,基于串联质谱技术的蛋白质组学逐渐发展成熟,翻译后修饰的研究也大规模的展开。为了促进翻译后修饰的研究,前期工作开发了一个翻译后修饰在线数据分析平台SysPTM,重点收集了翻译后修饰质谱实验数据,并提供了四个在线数据分析工具:序列比对工具PTMBlast、通路分析工具PTMPathway、位点聚类分析工具PTMCluster和保守性分析工具PTMPhylog。SysPTM自2009年发表以来已得到了研究人员的广泛应用。然而,随着翻译后修饰研究的不断深入,前期开发的SysPTM在数据资源和分析性能上都存在很大的局限性。因此,本论文构建了升级版的翻译后修饰数据库SysPTM2.0(http://lifecenter.sgst.cn/SysPTM/)。目前,SysPTM2.0包含53,235条蛋白质的471,109个修饰位点,一共涉及的修饰类型超过100种,覆盖了2,031个物种,含有的数据量是第一版的两倍多。SysPTM2.0的数据分析模块不仅对原有的四个分析工具的功能进行了增强,同时开发了全新的功能富集分析工具PTMGO,用于修饰蛋白生物学功能的分析。此外,SysPTM2.0构建了一个用于组蛋白翻译后修饰浏览与分析的专题模块SysPTM-H,并收集了组蛋白修饰酶的在癌症细胞系的表达数据。SysPTM2.0的改进工作还包括:统一的蛋白标识符,全新的动态用户访问界面,全新的数据浏览工具以及更深层次的蛋白质基因组注释信息等。现在,SysPTM2.0不仅为深入分析蛋白质翻译后修饰提供了丰富的数据资源基础,同时为进一步解析高通量蛋白质翻译后修饰数据提供了有力的分析工具。本论文后续研究对SysPTM2.0包含的数据集进行了大规模水平的分析。通过对修饰位点和修饰类型的统计分析揭示了修饰在蛋白质序列不同区域的分布规律,同时揭示了不同修饰之间复杂的交互调控机制,如乙酰化、泛素化、磷酸化和糖基化修饰在信号通路和生物学功能富集中都高度相似。此外,结合数据分析模块对数据进行了深入挖掘,如利用PTMCluster发现修饰位点聚类的中心可作为特征值帮助研究距离相近的修饰位点的潜在交互作用机制。本论文结合蛋白质的各级结构发现翻译后修饰位点具有不同的序列模体,对蛋白质二级结构有不同的偏好性,并倾向位于蛋白三级结构的表面。这些结论对理解复杂生命活动中的翻译后修饰机制有重大的意义。