【摘 要】
:
Internet中存在着大量的化学信息资源,在这些海量信息面前,用户要查找自己需要的信息,必须要借助于搜索引擎。目前,很多化学结构信息采用了系统命名法、线性码等方法进行描述
论文部分内容阅读
Internet中存在着大量的化学信息资源,在这些海量信息面前,用户要查找自己需要的信息,必须要借助于搜索引擎。目前,很多化学结构信息采用了系统命名法、线性码等方法进行描述,但是这些化学结构描述方法本身难以实现化学结构的检索,且Google、百度等通用搜索引擎目前只能按文本关键词进行检索。如要有效地利用Internet中这些化学资源,必须要建立针对这些资源的化学结构搜索引擎。在分析化学结构不同描述方法的基础上,为方便化学结构的检索,科技文档描述语言ScienceML中采用了CML(Chemical Markup Language)作为描述化学信息的标记语言;结合现代信息检索技术和化学结构检索的特点,设计了一个化学结构搜索引擎(Chem Search),实现了化学结构的全结构、子结构、结构相似性检索。为了在检索时可以快速地查找化学结构,化学结构在数据库中的存储位置采用Hash函数来定位;网络机器人采用“关键词匹配算法”来指导其爬行,以减少搜索范围,提高网页采集性能;化学结构相似性检索采用了改进的基于图特征矩阵索引的检索算法,进一步提高了相似性检索的效率;用户可以通过浏览器直接访问Chem Search,输入要检索化学结构的SMILES或InChI,也可以借助于提供的JME分子编辑器直接绘制出化学结构,并指定检索类型,得到检索结果。实验证明Chem Search可以有效地实现对化学结构的检索。下一步的研究重点是如何有效地识别与提取以图片形式表示的化学结构信息,实现对这一部分化学信息的检索,以丰富Chem Search的检索内容。
其他文献
本文介绍了一个以TI公司的TMS320DM642为核心芯片的DSP车牌识别系统设计、实现和优化。该系统首先通过摄像机拍摄车辆的视频,输入视频信号到DSP板卡;然后从输入的视频信号中
现代社会中,项目管理已成为经济发展的重要构成要素。在激烈竞争的环境下,各种复杂项目具有大量的信息需要管理,为实现信息的动态管理、提高项目的完成质量和管理效率,必须依赖于
图是数据结构中重要的组成部分。在图模型中,点代表事物,边代表事物之间的关系。图模型有着非常广泛的应用背景,如生物网络、web网络、计算机网络等。近几年来,随着互联网的
随着网络应用的不断扩大,一个企业往往要运行很多并不一定基于Web的应用,于是,SSL VPN(Secure Socket Layer Virtual Private Network)相对IPSec VPN的种种优点,就显得微不足
在漫漫的人类历史长河中,实现个性化学习一直是教育领域孜孜以求的奋斗目标。互联网出现后,研究者开始关注如何运用网络这个学习传递平台来实现个性化、适应性学习,以更好的
随着3G时代的到来,SVG做为XML在图形图象方面的应用越来越广泛,已经成为二维图形成像的既定标准和MMS的主流技术。而嵌入式移动产品这类低端设备作为潜在的、巨大的市场理应
随着计算机和图像处理技术的发展,数字图像拼接技术在现实生活中发挥着越来越大的作用,其应用前景也越来越广泛。本文详细阐述了图像拼接技术的关键技术要点,并从特征点匹配和光
连接查询操作是联机分析处理系统(OLAP)的重要操作之一,也是企业决策人员从海量数据中提取信息的重要手段。而多表连接运算一直是连接查询操作的主要瓶颈。随着大数据时代的
随着卫星技术和计算机技术的飞速发展,数字遥感卫星影像已经在各行各业中发挥着越来越大的作用。但是遥感卫星影像在实际应用前必须经过预处理,而目前的处理方法还存在着很多
作为一种特殊的分布式计算框架,网格的动态、异构、多域等特性决定了网格安全的重要性。网格安全主要是解决实体之间的认证和授权问题。Globus项目中的安全基础设施GSI(Grid