面向生物医学文献的文本挖掘技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:lanqin2394
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在后基因组时代,生物学研究已由对生物学单体研究(基因、蛋白、其他生物分子等)快速向对整个生物系统的研究方向转变。如今绝大多数生物医学文献都可在网络上检索,包含了丰富的生物学知识,也是获取国际上生命科学最新研究成果的最主要的途径。尽管公共数据库中的一些文献已由专家人工进行了内容提炼和分类整理,但相对于记载新发现的文献涌现的速度来说,还是远远落后。由于生物学名词的缩略性、模糊性和多义性,从海量文献中自动提取出生物学知识是非常困难的。而随着新文献数量的与日递增,需要有一种从海量文献中自动快速提取生物学知识的方法来辅助研究。 我们将主流的文本挖掘技术运用在生物信息学领域,运用自然语言处理和本体技术,对生物医学文献进行挖掘。在分析生物医学文献特性的基础上,设计开发了基因疾病相关文献挖掘平台,综合运用网络蜘蛛、句法剖析、语义语用分析、生物医学领域专业知识库标定等技术,对基因和疾病相关文献进行深度挖掘,进行基因功能、基因与疾病关系、生物分子相互作用网络知识发现。该平台收集了当前主流的生物学知识库和分析技术,实现了对文献的智能挖掘,可以向从事基因研究、人类疾病研究和其他生命科学相关领域研究的科研工作者或医务工作者提供实时的在线服务。 经实验证明,我们的技术能够对文献进行深度挖掘,进行基因功能、基因与疾病关系、生物分子相互作用网络知识发现,辅助形成生物科学研究创新假设。与人工分析相比,我们开发的平台分析结果的准确率可以达到86%。
其他文献
肺癌是全球发病率和死亡率最高的恶性肿瘤,严重危害人类健康。文献表明,p73基因第二外显子G4C14-A4T14和MDM2基因SNP309多态性与肺癌易感性有密切关系,且miR-200b能通过调控通路
尿沉渣检查是临床检验和诊断鉴别的重要方法。目前,临床上对尿液中有形成分的检验主要还是依靠人工镜检的方式。该方式工作强度大,主观程度强,且主要集中于有形成分的定性检
本文研究了一种用于桥接周围神经缺损的新型复合膜材料。首先合成了RGD接枝的高分子聚(羟基乙酸-L-赖氨酸-乳酸)(简称PRGD),通过物理共混一定比例的聚乳酸(PDLLA)、β-磷酸三