基于CML关系化存储的化学表达式知识库设计与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:gmwzg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类社会发展到现在已经进入到一个知识大爆炸的时代。为了应对知识的迅速累计,将知识信息化成为了必然的趋势。信息化的一个重要的特征就是强大的知识检索功能。在各种检索工具出现以后,人们在浩如烟海的知识面前不再茫然无措。   本文以信息化在化学教育领域应用的案例一化学学习助手为出发点,阐述了学习助手子系统一化学表达式知识库引擎设计和实现的重点和难点。化学知识库引擎存储和管理了在化学教育中常见的知识信息,其中核心信息为方程式,并提供知识检索功能。   XML在数据描述方面的诸多优点,知识库引擎选择了XML作为化学知识的描述语言。但由于XML在检索方面的不足,已经有较多的研究将XML结构模式(DTD)转化为关系模型,利用数据库成熟的技术进行检索。但由于DTD的复杂性,不利于这种技术的广泛使用。XSD是一种比DTD简单的结构模式,并且可以从XML内容逆向推导出XSD结构。本文提出了一种基于XSD的将XML数据关系化映射到数据库中存储的方法,使得以XML作为数据描述、以关系化数据库存储检索这种优势互补的模式更加容易的应用到各种系统中。   另一方面,化学中存在一类特殊的分子式结构信息,对这类信息的检索其实是图的匹配问题。图的匹配本身是一个NP完全问题,因而分子式的结构匹配是知识库引擎实现的一个难点。本文提出了一种能够完全描述分子式结构的全息特征字符串,使用这种特征字符串可以利用数据库的高效的查询技术来尽可能的提高分子式结构匹配的效率。
其他文献
当前,无论是整个社会的发展还是电子十所自身的改革与发展,都对该所人事和工资管理提出了更高、更新的要求。建立以信息技术支持的现代人事和工资管理系统,是建设好电子十所
针对MEMS设计与加工脱节的问题,本文对MEMS工艺验证进行了研究,旨在使MEMS设计者在在进行工艺仿真以及MEMS器件加工之前,先对版图和工序进行可加工性验证,如果版图或工序是不可加
“众包”的工作方式由来已久,并且日益盛行。通过“众包”的方式,雇主可以从人群中购买服务,整合人力来完成一个复杂的工作。近些年来,“众包”方式被广泛应用于互联网中,“
5.12汶川大地震,给我国的人民、经济、交通等带来了无法估计的损失。灾区多数的建筑物、公共设施、道路等已经完全毁掉,原来地图上的一些表征已经不足以表达目前的实际情况,
随着计算机计算能力的迅速增长,网格计算已经成为分布式计算的重要研究内容。目前,以网格为基础架构的e-Science协同环境下已经集成了大量的计算资源和数据资源,这些资源大多
近年来,P2P技术随互联网技术的发展而兴起,成为网络技术研究的热点。而基于P2P网络构建的存储系统,相比传统存储系统具有如下优势:不依赖中心节点、高容错、高扩展、高效率、低成
数据分类是一种重要的数据挖掘技术,常用的数据分类方法有决策树归纳分类、贝叶斯分类、神经网络分类和K最邻近分类等,采用的理论及算法有决策树(Decision Tree)、粗糙集(Rough
随着互联网的发展,Web不仅实现了全球的信息交换和资源共享,而且Web上的信息量也成指数级的增长。一方面,海量的Web信息为用户提供了获取信息的源泉;另一方面,如何高效的从海
连续属性的离散化一般是做为机器学习、数据挖掘的一项重要的预处理步骤,针对离散化问题,研究者们提出了诸多方法,例如早期的等宽等频算法及后来的利用遗传算法进行离散化等
近年来,计算机技术已经有效地应用于部队的设备管理工作中。随着部队设备综合信息管理系统的广泛使用,各分区系统的数据量将越来越大,同时军区数据中心也积累了大量的设备维修数