论文部分内容阅读
背景强直性脊柱炎(Ankylosing spondylitis,AS)隶属于脊柱关节炎。尽管近年来诊疗技术和精准靶向药物的进步,在很大程度上改善了强直性脊柱炎患者的早期诊断状况和远期预后程度,但其仍存在早期漏诊率较高、初诊最易伴有关节破坏、对治疗结果存在巨大个体差异、即使已获治疗仍易产生脊柱损害等诸多问题。骨桥形成是强直性脊柱炎最严重的预后结局,目前对强直性脊柱炎机制的探索不足以解释骨桥形成进程,也缺乏有效的生物标志物和预测手段。通过高通量测序,发掘基因层面的发病机制和具有临床意义的可靠生物标志物是当下研究各类疾病的热门方法。近年来,不断有证据证实lncRNA在多种AS进程中发挥关键作用,如炎症依赖途径、成骨、成脂、成血管生成、Notch信号通路、TNF信号通路等。本研究通过对强直性脊柱炎患者与正常对照组之间差异表达RNA谱的深入分析,寻找AS新骨形成中具有潜在作用的lncRNAs,探索其可能参与的ceRNA机制,然后采用实时荧光定量PCR(quantitative real-time polymerase chain reaction,q RT-PCR)方法检测AS患者和正常人群目标lncRNAs的表达,并进一步分析目标lncRNAs表达水平与AS临床特征和预后预测之间的关系,探讨目标差异表达lncRNAs作为潜在AS生物标志物的预后预测价值。方法1.筛选目标lncRNAs:通过RNA测序(RNA-sequencing,RNA-seq)获得5例AS患者和3例健康正常人全血细胞中lncRNA表达谱和m RNA表达谱,对数据质量进行校验,并注释基因。使用R语言分析RNA表达谱,发掘表达差异显著的RNA,定义显著差异表达评判标准为表达变化的绝对比值(fold change,FC)≥2或≤0.5,错误发现率(false discovery rate,FDR)<0.05。对差异表达RNA谱进行GO分析和KEGG通路分析,P<0.05的GO条目和KRGG通路被认为是显著富集。选择在患者中表达一致且差异显著,或GO和KEGG富集在成骨相关条目的差异表达lncRNA作为候选lncRNAs。通过Gene Cards和文献检索获得数十种AS已知的生物标志物,运用R语言多基因相关性分析观察候选lncRNAs与AS已知生物标志物的相关性,筛选有价值的作为目标lncRNAs。2.m RNA表达谱富集分析和miRNA预测:对m RNAs表达谱以及两个目标lncRNAs的共表达m RNAs进行GO和KEGG富集分析。共表达基因是lncRNA上下游的编码基因,可能与lncRNA有共同的调控机制。通过计算目标差异表达lncRNAs与上下游10kb范围内编码基因之间的Pearson相关系数,进行共表达分析。目标lncRNAs与编码基因关系对的相关系数需>0.6且P<0.05,将两组数据集进行并集,得到lncRNAs的顺式作用靶点。随后,全部m RNA基因谱进行GO分析和KEGG通路分析,P<0.05的GO条目或KRGG通路被认为是显著富集。探寻显著富集在成骨相关条目或AS发病机制相关条目的m RNA。使用miRNA在线数据库DIANA-miRPath v2.0分析lncRNA与miRNA的相互作用,得到与候选lncRNAs有联系的miRNAs。使用miRNA-m RNA专业预测网站Target Scan分析m RNA与miRNA的相互作用。3.构建ceRNA网络:对获取的lncRNA-miRNA,miRNA-m RNA这两组数据取交集,获得既与目标lncRNA关联,又与m RNA关联的miRNA。基于这些关键RNA,建立AS的关键lncRNA-miRNA-m RNA ceRNA网络,使用Cytoscape软件实现数据可视化。4.q RT-PCR:收集68例AS患者(38例无骨桥形成、30例伴有骨桥形成)和29名健康人的外周血标本及临床指标。使用TRIzol法提取外周血单个核细胞的总RNA,使用分光光度计对样本A260/A280处的吸光度进行质检。采用q RT-PCR方法检测AS患者和正常对照人群目标lncRNAs表达水平,每个样本重复三次,计算相对表达量(relative quantity,RQ),RQ=2-△△CT。5.临床资料收集及相关指标计算:收集年龄、病程、延迟诊断时间、血沉、C-反应蛋白等一般临床资料,计算基于CRP的AS疾病活动性评分(ankylosing spondylitis disease activity scores based on CRP,ASDAScrp)、Bath强直性脊柱炎功能指数(Bath ankylosing spondylitis disease activity index,BASDAI)、腰背痛的视觉模拟评分(Visual analogue scale,VAS)改良Stoke强直性脊柱炎脊柱评分系统(Modified Stoke Ankylosing Spondylitis Spine Score,m SASSS)、加拿大脊柱骨关节研究协会评分系统(Spondyloarthritis Research Consortium of Canada,SPARCC)等。6.探索目标lncRNAs的临床价值和数据分析方法:采用SPSS 24.0软件进行临床资料分析。符合正态分布的计量资料以x±s表示,两组间比较采用t检验(方差不齐时采用t’检验),三组间比较采用方差分析(ANOVA);不符正态分布的计量资料以中位数(M)/(P25~P75)表示,组间比较采用非参数检验;计数资料以例数和百分比表示,组间比较采用χ~2检验、Fisher检验或二项分布检验。(2)观察不同疾病活动、结构损伤程度时,目标lncRNAs的表达差别。(3)相关分析,符合正态分布的计量资料之间的相关性,观察依据Pearson相关系数;不符合正态分布、以及计数资料之间的相关性,观察指标为Spearman秩相关系数。(4)对计量资料影响因素的分析采用线性回归模型。对于计数资料影响因素的分析采用单因素和多因素logistic回归模型,包括单因素和多因素logistic回归。(5)采用校准曲线和ROC曲线下面积评估目标lncRNA和模型的预测性能和预测的特异性、敏感性。结果1.RNA测序结果:共获得205差异表达lncRNAs,其中上调的有67个,下调的有138个。218差异表达m RNA,其中上调的有153个,下调的有65个。2.获取目标lncRNAs:结合富集分析,选择表达水平高,一致性好,功能尚未被注释的lncRNA ENSG00000254910、lncRNA ENSG00000278238、lncRAN ENSG00000235245作为候选lncRNAs。进一步分析发现,lncRNA ENSG00000254910、lncRNA ENSG00000278238与十多种AS已知生物标志物有关,其中不乏结构损伤标志物,提示lncRNA ENSG00000254910、lncRNA ENSG00000278238与AS密切相关,故作为本研究的目标lncRNAs。3.m RNA表达谱的富集分析:m RNA表达谱富集分析结果显示,5个lncRNA ENSG00000254910、lncRNA ENSG00000278238的共表达m RNA(SOCS3,TNFAIP3,EDN1,ATF4,JUN)显著富集在KEGG分析排名第一的条目TNF信号通路上。4.miRNA预测和ceRNA网络:miRNA的发掘中,lncRNA ENSG00000254910、lncRNA ENSG00000278238匹配到57个相互作用的miRNA,SOCS3,TNFAIP3,EDN1,ATF4,JUN得到964个相互作用的miRNA。求两者交集,得到30个关键miRNA。构建的lncRNA-miRNA-m RNA ceRNA网络提示可能通过TNF信号通路在AS中发挥作用。5.lncRNA ENSG00000254910和lncRNA ENSG00000278238在AS及正常对照组中的表达情况:两个目标lncRNAs在有骨桥形成和无骨桥形成的AS患者中的表达均显著高于正常对照组(P<0.01)。lncRNA ENSG00000254910在有骨桥形成组中的表达水平高于无骨桥形成组(P=0.005),在患者中的表达显著高于正常人群(P<0.001)。lncRNA ENSG00000278238在有骨桥形成组的表达与在无骨桥形成组接近(P=0.057),但同样较正常人群显著升高(P=0.001)。6.目标lncRNAs在不同疾病活动状态下的表达情况:lncRNA ENSG00000254910表达在ASDAScrp 4个疾病活动组间有统计学差异(P=0.008),在BASDAI缓解组的表达高于BASDAI活动组(P=0.018)。lncRNA ENSG00000278238在各组疾病状态组间差异无明显统计学差异。7.目标lncRNAs在不同结构损伤状态下的表达情况:lncRNA ENSG00000254910在骶髂关节II、III、IV级患者中的表达呈逐渐升高的趋势(P=0.006),在X线可见脊柱受累(P=0.002)和骨桥形成(P=0.005)的患者中表达显著高于无受累患者。lncRNA ENSG00000278238在骶髂关节MRI伴有骨髓水肿的AS患者中表达升高(P=0.046)。8.相关分析:lncRNA ENSG00000254910与反映疾病活动的指标:VAS评分(r=0.371,P=0.005)、BASDAI评分(r=0.368,P=0.002)存在相关性,也与结构损伤指标:枕墙距(r=0.217,P=0.027)、X线检查的骶髂关节分级(r=0.381,P=0.004)、BASFI评分(r=0.270,P=0.026)和骨桥形成(r=0.380,P=0.003)存在相关性。lncRNA ENSG00000278238则与BASDAI评分(r=0.325,P=0.007)和骶髂关节X线分级相关(r=0.272,P=0.041)相关。9.回归分析:以目标lncRNAs相对表达量和临床相关指标作为自变量,带入以ASDAScrp作为应变量的线性回归模型,通过后退模型筛选,最终lncRNA ENSG00000254910(β=-0.229,t=3.080,P=0.003)、ESR(β=0.465,t=4.366,P<0.001)、CRP(β=0.391,t=3.681,P=0.001)被纳入模型(P<0.001),模型R~2值0.680,F值42.016,P值<0.001。m SASSS评分作为应变量的线性回归分析显示,lncRNA ENSG00000254910(β=0.473,t=3.560,P=0.001)、ASDAScrp(β=0.287,t=2.157,P=0.037)被纳入模型。模型总R~2值0.252,F值7.430,P值0.002。骨桥形成为应变量的logistic回归分析结果提示,lncRNA ENSG00000254910(OR值=1.324,P=0.048)、延迟诊断时间(OR值=1.289,P=0.035)、骶髂关节X线分级(OR值=4.613,P=0.026)是骨桥形成的临床危险因素,特别是lncRNA ENSG00000254910,预测骨桥形成的ROC曲线下面积为0.739,约登指数0.405,敏感性0.800,特异性0.605。10.预测骨桥形成的预测模型:模型依据logistic分析结果,包含指标lncRNA ENSG00000254910、延迟诊断时间、骶髂关节X线分级。校准曲线显示,模型预测概率与实际概率非常接近,模型的ROC曲线下面积为0.870(95%CI=0.780~0.959,P<0.001),最佳约登指数为0.637(敏感度=0.900,特异度=0.737)。结论1.通过测序获得AS患者和正常对照组全血细胞中RNA表达谱,经RNA差异表达谱分析、共表达基因分析、GO和KEGG通路分析,发现lncRNA ENSG00000254910和lncRNA ENSG00000278238在AS患者中表达一致性好且功能尚未被注释,与正常人比较其表达差异显著、且与AS多种生物标志物相关。2.lncRNA-miRNA-m RNA交集组合构建的ceRNA网络提示lncRNA ENSG00000254910和lncRNA ENSG00000278238可能通过ceRNA网络机制调控TNF信号通路,参与AS的发展或进展。3.lncRNA ENSG00000254910与多种疾病活动指标、结构损伤指标相关,是骨桥形成的危险因素之一,有可能成为AS患者骨桥形成的有效预测因子。4.基于lncRNA ENSG00000254910和传统的临床危险因素(延迟诊断时间和X线分期)的模型,可以预测AS患者骨桥形成的概率,为AS个体化诊疗提供了新思路。