时间序列数据分析和GSA方法的生信工具开发

来源 :广州医科大学 | 被引量 : 0次 | 上传用户:logepark
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景:(1)疾病关于时间的研究往往是比较复杂且难以有系统全面的方法。分析基因共表达的时间变化有助于理解基因调控的复杂机制。(2)GSA方法各有千秋,如何选择正确的GSA方法和简便地使用以代码形式的GSA方法,促使我们利用以代码形式存在且能适应不同条件的GSA方法,开发出图形界面,以提高研究人员的基因集分析的效率。目的:(1)使用neo4j和shiny创建一个平台,用于时间序列的基因共表达网络研究。我们试图以COPD的数据集为例,创建一个shiny app为研究人员快捷查询到基因共表达情况的时间变化,以期望能够找到疾病发生发展中的关键基因和基因共表达调控模式。(2)构建一个Galaxy-GSA平台,将以R代码形式存在的不同GSA方法封装成Galaxy工具,方便研究人员使用和重复其结果。方法:(1)利用WGCNA方法对COPD时间序列的数据集GSE108134构建基因共表达网络,将基因和KEGG通路、GO术语关联,然后将基因表达网络导入到neo4j数据库中,最后使用shiny包创建可视化的shiny app,并利用该app对COPD的基因共表达网络进行分析。这个shiny app主要有三个页面:Genes Relationships in KEGG Pathway/GO Term、Genes Neighborhoods Relationships和Alluvial Diagram。(2)首先安装Galaxy,然后选择适用于Galaxy环境的GSA方法。之后为这些GSA方法创建Galaxy XML文件和编辑R脚本代码。最后,将这些工具发布到Tool shed网站,并建立Galaxy-GSA平台。结果:(1)以COPD数据集为例,利用WGCNA方法,我们已经创建出一个shiny app,可以在不同条件下查看COPD的基因共表达情况,并且关联了KEGG和GO,可以快速地描绘出不同条件下基因-KEGG、基因-GO、基因-基因三者之间的动态图。分析COPD数据集,我们发现,IL1β在不同时间点都会与CCR1、ILRN、PLAUR、PROK2、CXCR2、SRGN、FPR1、S100A9等基因共表达,且IL1β与多个KEGG通路、GO术语有关,在COPD的基因共表达中有关键作用。与健康非抽烟者和健康抽烟者不同,COPD抽烟者的基因共表达网络集中在G蛋白偶联受体信号通路、炎症反应、信号转导等生物学过程。(2)我们已经创建了一个包含GSA工具的Galaxy-GSA平台,并为之新建了7个适应不同条件的GSA工具。这些工具可以在Galaxy平台上利用图形界面进行基因集分析。比如:Reactome PA是利用超几何模型对一组Entrez基因来富集分析Reactome的通路,GSVA计算单个样本特异性富集统计量,生成通路-样本的矩阵,Chip Enrich和Methyl GSA是分别专门针对Chip-Seq数据和甲基化数据的GSA方法。我们已经测试了Reactome PA、SPIA、GSVA、chipenrich、methyl GSA、GSAR和mogsa工具,并将这些工具发布在Galaxy tool shed,以方便Galaxy管理人员安装,为更多研究人员提供GSA便利。结论:(1)COPD数据集的分析案例说明我们的shiny app在分析基因共表达网络的策略是可行的,以此为基础,我们将开发一个平台,使用户只需要输入基因的表达数据就可以利用这样的app进行基因共表达的深度分析。(2)GSA方法种类繁多且各有优缺点。对于一些已经广泛应用但对不会编程的科研人员并不友好的GSA方法,我们已经创建了Galaxy-GSA系列工具,发布Galaxy GSA平台,为其提供图形用户界面,以便能够更多人选择适合的GSA方法。
其他文献
研究背景:根据WHO在2020年发布的最新数据显示,乳腺癌(breast cancer,BC)已超过肺癌,成为全世界女性发病率最高的恶性肿瘤。预计在2021年底,将有超57万名女性被新确证为乳腺癌,将有超过9万名女性死于乳腺癌。近年乳腺癌的治疗手段不断的更新迭代,无论在化疗方案的多样性,还是手术方式更新和放射治疗,尤其是靶向治疗、内分泌治疗及免疫治疗等不断进步,都为乳腺癌患者带来了更多的获益,大大
背景与目的炭黑是指在燃料发生不完全燃烧时的产物,目前已被列入国际癌症研究机构组织的2B类致癌物质中。炭黑颗粒在药理学中的毒性破坏作用力与它们颗粒的尺寸大小紧密相关。与传统的微米级炭黑颗粒环境化学物相比,纳米级的炭黑颗粒所诱导的细胞受到损伤较为严重。研究证据表明炭黑纳米颗粒不仅可以引起细胞毒性、加重人类呼吸系统疾病,甚至可以造成DNA链损伤。环状RNA是非编码RNA的研究热点,大量研究表明,在化学物
【目的】孤独谱系障碍(Autism spectrum disorder,ASD),是一组以社会交往障碍和重复刻板行为、兴趣狭窄为核心症状的神经发育性疾病。社交障碍严重限制了患者融于社会的能力,给患者、患者家庭乃至整个社会带来了极大的负担。临床基因测序数据表明SHANK 3(SH3 and multiple ankyrin repeat domains 3)基因突变可导致ASD的发生。动物研究发现,
第一部分绝经后女性腰骶椎椎体CT值与骨密度的关系研究目的:通过比较腰骶椎椎体的CT值和双能X线骨密度仪(Dual energy X-ray absorptiometry,DXA)的检查结果,分析出绝经后女性腰骶椎椎体CT值与骨密度的关系,与椎体骨折的关系。材料及方法:分为2个样本研究,所有患者入院1周内均接受腰椎CT和DXA检测。样本1:收纳绝经后女性患者95例,其中年龄5996岁,平均(76.4
研究背景急性心肌梗死(acute myocardial infarction,AMI)是冠心病(coronary atherosclerotic heart disease,CHD)中的一种严重类型。根据2019年中国心血管病报告的数据,我国AMI发病率仍在不断增高,死亡率整体呈上升趋势。经皮冠状动脉介入治疗(percutaneous coronary intervention,PCI)是其重要的
学位
研究背景及目的:巴塞罗那临床肝癌分期(Barcelona Clinic Liver Cancer)对于B期(Intermediate stage)、C期(advanced stage)的肝细胞肝癌(Hepatocellular carcinoma,HCC)患者,治疗建议分别行TACE及索拉菲尼治疗。中国肝癌分期(China liver cancer staging,CNLC分期)诊疗规范,相比BC
学位
背景肥胖患病率的上升不仅伴随着心脑血管疾病增加,也伴随着生育力的下降。肥胖导致代谢紊乱和内分泌发生改变,损害女性生殖能力,其评估标准包括体重指数(Body mass index,BMI)、腰围(Waist circumference,WC)、腰臀比(Waist-to-Hip Ratio,WHR)及体脂率(Body fat rate,BRF)。近年来的研究表明肥胖与体外受精(In vitro fer
实验目的:基于C-H活化策略设计构建一系列具有抗肿瘤活性的新型含氟苯并异噁唑类骨架化合物。实验方法:(1)以N-苯氧基乙酰胺和偕二氟炔烃为原料,在过渡金属铑的催化作用下,以醋酸铯作为碱添加剂,TFE溶剂中60℃反应24 h得到目标化合物。密度泛函理论计算(DFT)用于解释催化偶联反应的机制。(2)采用A549肺癌细胞和MCF-7乳腺癌细胞进行含氟苯并异噁唑类化合物抗肿瘤活性的初步筛选,接着基于深度