论文部分内容阅读
伴随着互联网技术的不断发展,化学家开始意识到,多年来所积累的大量信息,只有通过计算机技术才能让科学界更容易获得和处理,换言之,这些信息必须通过数据库的形式存在,才能为科学界所用。在有机化学分析领域,碳-13核磁谱图一直发挥着重要的作用。本文所完成的基于Web的碳-13核磁谱图数据库的设计与实现问题,是中科院知识创新项目“科学数据库及其应用系统”和上海市政府重大项目“一网两库”工作的一个组成部分。其主要目的是方便化学工作者能及时有效的利用Internet,①通过化合物信息找到所需的碳-13核磁谱图;②通过谱图的信息找到相关或者相似的化合物。该系统是目前国内唯一提供化合物碳-13核磁谱图数据库Web检索,同时提供结构和谱图的图形输出,并给出其对应关系的数据库系统。本文共分五个部分:第一部分讨论了论文所研究课题的背景,分析了国内外关于碳-13核磁谱图数据库的研究现状,指出了目前国内尚无可图形显示化合物结构和核磁谱图,并反映它们之间关系的数据库,国外的免费核磁谱数据库也都以静态图片形式给出,当谱峰较多时,谱图与化合物结构之间的关系就不十分直观,影响了用户利用谱图和化合物结构进行分析和辨别。阐述了建立碳-13核磁谱图数据库的意义,并对用户需求进行了分析。第二部分讨论了如何建立一个基于SQL Server的碳-13核磁谱图数据库,在这个部分里,我们介绍了基于Web的数据库系统,B/S模式的选择,并详细分析了核磁谱图的化学位移,谱线强度,对应碳原子序号等基本数据,同时从数据库的概念设计,逻辑结构设计,物理设计三个方面,结合微软的MS-SQL Server 2000数据库系统给出了碳-13数据库的详细设计过程。最后,论文给出了碳-13核磁谱图数据库在MS-SQL Server 2000中的数据表创建,数据装载,索引创建等详细的实施过程。第三部分分析了界面设计方面基本的用户需求,数据库系统的易用性、一致性和提供的功能是系统流程首要满足的条件。核磁谱数据库在实施Web检索时,让用户设定查询参数表,尽量将各种决定权交给用户,并将复杂的处理和分析放在后台,让用户将主要精力集中在谱图数据的分析和利用上。当得到了用户来源的核磁谱数据后,系统应该提供相应的数据显示和检索选项入口,使用户可以选择和调整各项检索参数,这包括谱峰的选择和核磁谱的属性限定。查询得到的结果首先是化合物名称,让用户决定只查看其认为真正匹配的结果或其感兴趣的化合物基本性质数据和对应的核磁谱。同时应该提供多个核磁谱的输出和比较,让用户可以对任意核磁谱的任何谱峰进行对比和分析。本部分还讨论了针对数据库的Web检索的设计实现,分析了基本的检索流程,比较了几种流行的Web数据库访问技术,并根据检索流程,给出了利用ASP和ADO实现检索的具体过程。在谱图的模糊检索中,对比了ASP程序和SQL语句两种不同的实现方法,详细分析了其在系统负荷方面的优劣,并做出选择。第四部分讨论了谱图Web输出的实现,分析了在谱图输出方面的用户需求,并比较了静态的图像输出和动态图形输出的特点,指出Web数据库图形化显示基本上可归纳为三种方案:一是将服务器端数据先生成图片,再在网络上传输,这种方式由于进行传输的图片体积大,占用空间多,效率很低;二是利用VC,VB,DELPHI等开发ActiveX控件实现,此种方式需将控件程序下载到本地机上,在很大程度上受到机器和平台的影响;三是利用Java Applet实现,由于Java的平台无关性、可移植性、安全性、简洁性,因此这是解决Web数据图形化的最实用方案。通过比较和选择,我们给出了利用Java Applet输出谱图,并实现谱峰强度归一化,峰的标识,化学位移的标识,核磁谱比较等方面的实现过程。第五部分介绍了系统最终效果演示,并总结了系统的两个主要特点。一是谱图数据的模糊检索。在检索入口上,给出谱峰位置(即化学位移)和误差范围两个入口,用户可以在谱峰数目和谱峰准确位置这两个方面实现模糊检索。二是使用Java Applet显示NMR图,使得谱图的交互得以实现,便于用户迅速获得所关注单个峰的相关信息。