固有无序蛋白质无序区和有序区氨基酸组成偏好性分析

来源 :江苏农业科学 | 被引量 : 0次 | 上传用户:jj__yy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:以固有无序蛋白质为研究对象,通过CD-HIT对数据进行去冗余处理,然后利用编程软件对数据进行统计而得到新的数据。对所有无序区及有序区的氨基酸含量进行对比,认为氨基酸Val、Ile、Leu、Phe、Trp、Asn、Tyr、His具有形成有序结构的偏好性;氨基酸Pro、Ser、Gln、Asp、Lys具有形成无序结构的偏好性。研究结论有助于进一步挖掘固有无序蛋白质的序列特征,并为固有无序蛋白质的预测提供一些借鉴。
  关键词:固有无序蛋白质;功能位点;无序区;序列分析
  中图分类号: Q516 文献标志码: A 文章编号:1002-1302(2014)04-0038-02
  收稿日期:2013-08-23
  基金项目:山东省自然科学基金(编号:ZR2010CQ041)。
  作者简介:王红梅(1974—),女,山东德州人,硕士,副教授,主要从事生物信息学的研究。E-mail:whm_2327@126.com。蛋白质是生物体中最重要的两类大分子之一,传统思想认为蛋白质要实现其生物功能,必须先折叠成一个稳定的三维结构,因此形成了蛋白质结构决定其功能的主流观点[1]。然而随着基因工程方法和实验技术的发展以及基因组计划的开展,在20世纪90年代初,人们发现有些蛋白质或蛋白质序列中的一部分区域在生理条件下不具有一个确定的三维结构,但是依然能够正常行使生物学功能。进一步研究发现的这类蛋白质越来越多,并逐渐形成了一种新的蛋白质类型,称为固有无序蛋白质(intrinsically disordered proteins,简称为IDPs)[1-3]。对目前存在的大量基因库数据进行分析发现:蛋白质的无序结构与蛋白质功能之间关系密切,无序蛋白质在诸如转录、翻译、调控细胞信号转导、蛋白质磷酸化及小分子存储等过程中发挥着重要的作用;另一方面,无序蛋白质又经常与多种疾病联系在一起。与人类癌症相关的蛋白质中,无序蛋白质的含量高达79%;在心血管疾病有关的蛋白质中,无序蛋白质的含量也高达57%。无序区是固有无序蛋白质发挥功能的主要区域,功能位点大多分布在该区域,因此预测蛋白质的无序区成为判断蛋白质是否无序的热点问题。Romero 等在1997年首次对蛋白质无序区域进行预测,他们预测的准确性达到70%,此后无序蛋白质的预测方法得到了迅速发展,目前应用于无序蛋白质序列预测的方法已经超过50种,并且这些预测方法的准确性普遍达到85%以上。
  本研究基于序列分析的方法,以DisProt数据库中的固有无序蛋白质为研究对象,通过CD-HIT程序对数据进行去冗余处理,将处理后的数据利用编程软件Matlab 7.0进行统计而得到新的数据;对新数据进行分析,通过编程把序列的无序区和有序区分别提取出来,再分析无序区和有序区氨基酸组成的偏好性。本研究有助于进一步挖掘固有无序蛋白质的序列特征,从而为固有无序蛋白质的预测提供借鉴。
  1数据来源及去冗余处理
  1.1数据来源
  本研究以固有无序蛋白质数据库DisProt(版本6.01)[4](http://www.disprot.org/index.php)为研究对象(发布日期为2012年10月15日),下载数据库中最新的固有无序蛋白质进行研究,共有无序蛋白质684个,无序区1 513个。
  1.2去冗余处理
  由于蛋白质序列数据库中都含有大量的冗余序列,它们通常不能提供更多的信息,而且不利于数据的统计分析,并且由于冗余序列要占用更多的计算机存储和处理资源,因此去除这些冗余信息具有很高的实用价值,不但可以减小数据库的大小、提高序列搜索的速度,而且有助于对数据的统计分析。本研究利用去冗余程序CD-HIT[5-6](http://weizhong-lab.ucsd.edu/cdhit_suite/cgi-bin/index.cgi)对数据进行处理,将相似度阈值设为30%。结果显示:去冗余前,固有无序蛋白质共有684条序列;去冗余后,蛋白质共有549条序列。
  2固有无序蛋白质无序区和有序区的氨基酸组成偏好性分析
  用Matlab编程对全部序列(去冗余后)提取无序区和有序区。无序区包括112个全部无序区(如DisProtDP00001,108个氨基酸都是无序的)以及非全部无序蛋白质(蛋白质中含有无序片段)序列中的各条无序区;无序区的氨基酸总数为64 243,约占固有无序蛋白质氨基酸总数的28.67%。因此可以看出:固有无序蛋白质中有序区的氨基酸数大约是无序区氨基酸数的3.5倍。结果表明,固有无序蛋白质的氨基酸在有序区的含量要大大高于无序区,即固有无序蛋白质的大部分组分都是有序部分。
  对固有无序蛋白质中的所有无序区及有序区的氨基酸个数和含量进行对比,以分析每种氨基酸的偏好性。通过 Matlab 软件进行处理得到了固有无序蛋白质中的无序区和有序区的所有氨基酸含量及差值,详见表1。
  3结论
  本研究以DisProt数据库中的固有无序蛋白质为研究对象,先通过程序CD-HIT对数据进行去冗余处理,然后利用编程软件Matlab7.0对数据进行统计而得到新的数据,再对数据进行分析。结果表明:氨基酸Val、Ile、Leu、Phe、Trp、Asn、Tyr、His具有形成有序结构的偏好性;氨基酸Pro、Ser、Gln、Asp、Lys具有形成无序结构的偏好性。
  无序蛋白质具有独特的氨基酸组成特点,这些独特的氨基酸序列决定了其无序的结构。无序蛋白质的研究将促进人们重新认识蛋白质的结构和功能关系,也将为蛋白质的全新设计和疾病的治疗提供新的思路。相信随着研究数据的增加,对固有无序蛋白质的研究将更深入和全面,从而能够进一步加深对这类蛋白质的认识。
  参考文献:
  [1]Uversky V N. Natively unfolded proteins:A point where biology waits for physics[J]. Protein Science,2002,11(4):739-756.
  [2]Dunker A K,Obradovic Z,Romero P,et al. Intrinsic protein disorder in complete genomes[J]. Genome Informatics,2000,11:161-171.
  [3]Dunker A K,Oldfield C J,Meng J,et al. The unfoldomics decade:an update on intrinsically disordered proteins[J]. BMC Genomics,2008,9(S2):12-18
  [4]Sickmeier M,Hamilton J A,LeGall T,et al. DisProt:the database of disordered proteins[J]. Nucleic Acids Research,2007,35(S1):786-793.
  [5]Li W,Godzik A.Cd-hit:a fast program for clustering and comparing large sets of protein or nucleotide sequences[J]. Bioinformatics,2006,22(13):1658-1659.
  [6]Li W,Jaroszewski L,Godzik A. Clustering of highly homologous sequences to reduce the size of large protein databases[J]. Bioinformatics,2001,17(3):282-283.
  [7]黄永棋,刘志荣. 天然无序蛋白质:序列-结构-功能的新关系[J]. 物理化学学报2010,26(8):2061-2072.刘思言,高玮,夏海丰,等.
其他文献
摘要:目的:探讨复方沙棘籽油栓治疗子宫颈糜烂的临床效果。方法:选择157例子宫颈糜烂患者,于月经干净后开始用药,将1枚复方沙棘籽油栓置入阴道后穹窿,每日1次,7次为l疗程,连用2个疗程后于月经干净后复查。结果:治愈96例(61.15%),显效30例(19.11%),有效22例(14.01%),无效9例(5.73%)。结论:复方沙棘籽油栓治疗子宫颈糜烂疗效可靠,无明显不良反应,值得推广应用。  关键
期刊
【摘要】超声图像的产生是由于超声波在不同器官的组织结构中的传播速度不同造成,由于患者个人体质结构的复杂性,机器灰度、增益、深度等的调节往往会产生超声断层图像与其相应解剖断面图像之间存在差异,而形成特有的声像图。本文将一些声像图的征象与对应解剖结构和相关疾病做一总结概括,方便同行诊断疾病时快速提取,应用和记忆。  【关键词】超声波;特征性声图像;解剖结构;疾病  Abstract:Based on
期刊
美舒利治疗类风湿关节炎的疗效和药理分析。方法:选取我院2010年1月-2010年12间收治的80例类风湿关节炎患者,给予患者口服尼美舒利,100mg/次,2次/天,4周为一个疗程,其中有40例患者使用一个疗程,另40例患者连续使用两个疗程。观察患者在疗程结束后的疗效和不良反应,对尼美舒利治疗类风湿关节炎的药理作用进行分析。结果:使用一个疗程的患者的总有效率为82.5%(66/80),不良反应的发生
期刊
摘要:急腹症是各临床急诊科室的常见病、多发病,具有发病急、病情重、进展快的特点,常需要及时而准确的做出初步诊断和处理意见。影像学技术是非常必要的。  关键词:影像学急腹症诊断应用价值  【中图分类号】R4【文献标识码】B【文章编号】1671-8801(2013)02-0112-01  急腹症是各临床急诊科室的常见病、多发病,具有发病急、病情重、进展快的特点,常需要及时而准确的做出初步诊断和处理意见
期刊
摘要:目的:探讨甘露醇不良反应致急性肾损害的发病机制,指导临床上合理用药。方法:回顾性分析我院24例甘露醇治疗急性脑出血患者致肾功能损害的临床资料。结果:本组24例患者用药后48h或72h即出现恶心,甚至呕吐,并逐渐加重。患者尿常规:尿蛋白(+)~(+++)16例,血尿(+)~(++)19例,管型尿7例。同时检测血尿素氮9.4~29.1mmol/L,血肌酐201~807.1mmol/L。经积极治疗
期刊
摘要:目的:对比观察气管插管洗胃与传统洗胃两种方法抢救重度口服中毒患者的临床效果。方法:从我院收治入院的重度口服中毒患者中抽取60例随机分为观察组与对照组,观察组患者实施气管插管洗胃抢救,对照组患者实施传统洗胃抢救,对比观察两组患者的临床效果。结果:观察组患者治疗有效率明显高于对照组,从开始抢救到胃管置管成功时间明显少于对照组,差异有统计学意义(P0.05)。  1.2.2方法。观察组患者实施气管
期刊
摘要:目的:本文主要是对探讨膝关节疼痛进行临床分析。方法:回顾性分析268例患者疾病的种类以及疼痛类型,以及针对患者疾病的类型等进行针对性的治疗方案。结果:在全身性疾病中,以痛风和类风湿疾病导致膝关节疼痛较为常见,其次是滑膜软骨瘤和结核;而在膝关节疾病分类中,以创伤性关节炎和感染性关节炎导致膝关节疼痛病例较多,其次是感染性关节炎。而在膝关节外疾病中,以腰部疾病导致的膝关节疼痛较髋部疾病患者多。膝关
期刊
摘要:目前为止,类风湿性关节炎(RA)的诊断还没有统一的严格标准,通常使用的诊断手法多是依赖于临床症状、影像学检查和实验室指标三个方面的综合考虑,其中影像学检查时对相关骨关节部门所进行的X线等多种检测指标。但是本文主张从循证医学角度对类风湿性关节炎的实验室诊断做出研究,以便提出最有利的诊断RA的实验室诊断方案。  关键词:类风湿关节炎实验诊断循证医学  【中图分类号】R4【文献标识码】B【文章编号
期刊
随着国家综合实力增强,经济发展稳健。国家上层对农村的施政逻辑发生了转变,由“汲取型”逐渐过渡为“给予型”。以往,政府通过向农民收取税费,实现经济资源的汇聚,进而优先发展工业。当经济快速发展后,产业结构面临转型。曾经排在榜首的农业现在已经落后于工业,服务业及其他新兴产业。因此,政府鼓励工业反哺农业,城市反哺农村。并且,作为一个现代化的治理主体,政府有责任和义务提高公民的生活质量水平,缩小城乡差距。通过减少贫困现象的发生,才能更好的促进公民的物质平等。基于这一治理逻辑,国家不断出台惠农政策,取消农业税减轻了农
摘要:比较了5种DNA条形码的重点关注基因psbA-trnH、ITS、ITS2、rbcL、matK在苍耳属中的遗传距离,以期为植物DNA条形码标准基因的筛选研究提供参考。用通用引物对7种苍耳属植物的psbA-trnH、ITS、ITS2、rbcL、matK基因进行扩增、测序,利用MEGA 5.1软件计算遗传距离及标准误。结果表明:ITS2、ITS、matK、psbA-trnH、rbcL基因在苍耳属中
期刊