论文部分内容阅读
基因芯片及高吞吐量的DNA测序机技术的发展导致了超大规模的基因组数据的集成,而将这些数据转化为有价值的生物信息是目前人们面临的最大挑战,同时也成为基因调控网络研究中的一个新领域。此外研究和了解基因调控网络因果关系以及对DNA序列功能的评价对人们生活具有重要意义。相对于国外,我国在这一新兴领域的研究水平还是处于落后阶段,因此本文将从两个方面对基因调控的研究进行完善:DNA序列可信度的预测和基因表达水平影响程度的预测。针对DNA序列可信度的预测问题,将模糊Petri网(FPN)与有色Petri网(CPN)相结合,提出了一种基于模糊有色Petri网(FCPN)的方法来对DNA碱基序列可信度预测的模糊推理过程进行建模。模型中使用三个输入变量来确定DNA碱基序列的可信度,分别为height,peakness和spacing。模型中的组成部分分别对应着不同类型的模糊操作,如If—parts和Then-parts等规则。FCPN模型在模糊Petri网的基础上结合了有色Petri网,这就使FCPN方法在保证等量信息的同时,可以克服原有网络规模大、计算步骤冗余、时间长的缺点,从而提供完整的结构化表示。再此基础上建立了 DNA碱基可信度推理的FCPN模型,并得出了最终结果,与FPN方法进行比较,FCPN模型表现出较好的适应性,简化了模型的同时提高了预测的准确性。针对基因表达水平影响程度的预测问题,提出一种基于逆向推理和模糊Petri网思想的算法来对激活/抑制和目标基因间的调控关系进行建模,即根据输入的激活/抑制(activator/repressor)基因的表达水平来预测目标基因表达水平值。该方法通过FPN模型对激活/抑制和目标基因三基因的正向推理得出目标基因表达值后,采用逆向推理理论对模型进行返溯,并对结果和模型进行分析。该模型不仅可以准确的预测目标基因的表达水平,很好的模拟了基因调控网络的因果关系,而且得到了规则库中具体的作用规则以及输入基因对目标基因表达的影响程度,从而有助于制药,疾病诊断等领域的研究与探索。最后通过实例对该模型进行了验证和分析。