【摘 要】
:
[目的]将同一篇引文文献的不同表达形式进行归一,实现期刊引文数据规范控制与管理,减轻引文失范造成的数据质量问题.[方法]以期刊引文数据库建设为目标场景,根据参考文献著录
【机 构】
:
中国科学院文献情报中心 北京100190;中国科学院大学经济与管理学院图书情报与档案管理系 北京100190;中国医学科学院医学信息研究所 北京100020;中国医学科学院医学信息研究所 北京1000
论文部分内容阅读
[目的]将同一篇引文文献的不同表达形式进行归一,实现期刊引文数据规范控制与管理,减轻引文失范造成的数据质量问题.[方法]以期刊引文数据库建设为目标场景,根据参考文献著录标准分析期刊引文数据的核心特征,基于决策树方法和准确率指标获取有效特征子集并指定决策规则执行优先顺序,生成多特征融合的自动数据处理策略.[结果]选取CBMCI的10 000条期刊引文样本数据集和10 000条验证数据集进行验证,本文方法进行期刊引文归一规范的准确率分别达99.72%、98.70%.[局限]仅探讨了中文期刊引文失范数据的处理,尚未考虑其他语种和类型的引文.[结论]该处理策略能够高效自动化地开展大规模期刊引文数据的归一规范,减少人工干预,特征融合的思路也适用于建立其他类型引文归一规范时的自动处理策略.
其他文献
该文针对学生用AutoCAD软件绘图时速度慢、效率低的现象,指出并分析了AutoCAD教学中存在问题及其原因。 提出了技校教师在教学实践中应用AutoLISP语言对AutoCAD进行二次开发,进
关于重大革命历史题材影视创作的几个问题●孙家正一、充分认识重大革命历史题材影视创作的重要意义重大革命历史题材影视创作的任务,是适应改革开放新的历史时期的需要,遵循历
[目的]比较中文术语粒度对不同字段的术语区分能力(Term Discriminative Capacity,TDC)测度的影响.[方法]将术语区分能力测度应用于题名、关键词、摘要和附加关键词的术语质
ATM网络结构的最底层为SAR层和ATM层,这一部分必须用硬件来实现,本章讲述高速接口的硬件/软件的实现方案。
[目的]利用用户、标签、图书三者之间的关系实现群组推荐.[方法]通过用户-标签、图书-标签的标注关系,利用K-means算法进行用户聚类和图书聚类,形成用户群组和图书群组,并进
该文介绍了在计算机建筑软件开发中,怎样利用AutoCAD的开放性,利用功能强大的AutoLISP语言,开发新的建筑制图命令的方法,并介绍了部分新命令的特点,以及在实距中的应用。
该文介绍了建筑电气设计人员利用AutoCAD软件绘图的一些技巧和经验, 并提出了对其进行定掉和改进的一些方法,以使其更加适合使用者的需要。
该文论述了如何将面向对象编程技术应用到AutoCAD程序开发中,并给出了几个应用类的原型声明、类的实现及使用方法。