基于机器学习的扫描图书元数据自动抽取研究

来源 :现代情报 | 被引量 : 0次 | 上传用户：wangzi7890

【摘要】

：

在对纸本图书数字化加工过程中，元数据录入是必需的环节，然而手工录入工作量大、效率低，针对这一问题，提出了一种基于机器学习的扫描图书元数据自动获取方法。首先定义元数据的描

【作者】

：

陈淑平梁东魁

【机构】

：

燕山大学图书馆,燕山大学信息科学与工程学院

【出处】

：

现代情报

【发表日期】

：

2013年6期

【关键词】

：

馆藏图书数字化元数据抽取特征分析信息抽取 collecllon of books digitization metadata extraction fe

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在对纸本图书数字化加工过程中，元数据录入是必需的环节，然而手工录入工作量大、效率低，针对这一问题，提出了一种基于机器学习的扫描图书元数据自动获取方法。首先定义元数据的描述、管理和结构元素，然后以扫描页面的DjVuxML文档为数据源，分析页面的格式、结构等特征，以行作为初始特征向量，采用基于有监督的机器学习方法进行元数据抽取。实验表明谊算法能够取得较高的准确率和召回率，能够显著的提高图书数字化的效率。

其他文献

云南风化胶磷矿浮选脱硅试验研究

根据云南风化胶磷矿的矿石性质,采用了单反扫选试验流程,并且采用了自行研制的ZP系列药剂（阳离子捕收剂）,该药剂的用量较少,能大大降低一般磷矿浮选的药剂成本并且取得了精矿品

期刊

风化胶磷矿浮选脱硅weathered phosphorite flotation desilieation

我国省级公共图书馆网站建设调查分析

本文从栏目设置、数字资源建设、用户交互、服务创新等方面对我国18个省级公共图书馆网站的内容建设情况进行调查分析,认为省级公共图书馆网站建设主要存在网站布局不合理、

期刊

公共图书馆网站建设调查public library website construction survey

网络行为读者需求分析运用探讨

[摘要]本文针对读者访问图书馆网站的特点，通过对网站访问行为进行跟踪记录、统计和分析，推断出一段时间内读者对图书馆的需求，根据结果将读者的真正需要的服务推送至图书馆管理层，根据需求实时调整服务，达到个性化满足读者的服务工作目的。　　[关键词]网络行为；需求；图书馆；CNZZ　　[中图分类号]G250.72 [文献标识码]A [文章编号]1008-0821（2015）05-0094-04　　随着高校

期刊

网络行为需求图书馆CNZZnetwork behavior demand library CNZZ

安徽某地长石石英降铁分离选别试验研究

石英长石的无氟浮选分离一直是个难题.本文对安徽某地石英正长岩进行原矿性质研究,表明其Fe2O3质量分数较高,且多存在于黑云母中,考虑到黑云母具有弱磁性,因此采用强磁选除去.通过磨矿细度和磁场强度试验,最终确定在磨矿细度为-0.074mm占77％,磁场强度为1432kA/m条件下,可除去产率为14.14％的黑云母,强磁尾矿中仍有1.70％的Fe2O3,为了减小黑云母在后续石英-长石浮选分离中的影响,

期刊

长石矿石英矿浮选流程产品质量

磷矿石制取磷酸氢钙新工艺

本文针对湖北远安磷矿的各成分质量分数特点，开发了两条制取优质磷酸氢钙的方案。方案1为直接采用盐酸溶浸磷矿石后用氨水中和除杂，过程中加入助剂和絮凝剂的方法。方案2为高温

期刊

磷矿石磷酸氢钙盐酸溶浸高温煅烧phosphate ore calcium hydrogen phosphate extrac-tion by hyd

幼儿托管还需公共服务托底

近日，有记者走访广东一些企业和职工发现，亲子园成职工最急需福利。小孩入托难、进好幼儿园难已经成为一大民生问题。对家庭而言，带娃上班可以有效缓解父母的育儿压力：办公楼里建

报纸

数字化学术期刊知识生态系统及其进化动因

为了系统、全面、动态地研究数字化学术期刊与其相关主体、环境的协同发展,本文运用知识生态学的理论和方法,提出数字化学术期刊知识生态系统并阐释其构成。在知识的生产、传

期刊

数字化学术期刊知识生态系统网络进化digital academic journals knowledge ecosystem network evolu

极限平衡与有限元法用于边坡稳定性分析的对比

为了研究极限平衡法和有限元法分析边坡稳定性的区别,基于两种方法的基本原理和计算稳定系数的公式,运用各自对应的分析软件计算了露天矿边坡的稳定系数,并详细地进行了比较,

期刊

露天矿边坡稳定极限平衡法有限元法surface mine slope stability limit equilibrium method finite

某浅埋矿床条带法开采地表沉降与开采强度关系的试验研究

针对上横山浅埋缓倾斜矿床条带嗣后充填回采条件,以物理相似模拟试验为基础,分析了矿床回采地表沉降（陷）变形特征。地表沉降在不同回采时步呈非线性变化,当最大不充填开采1-2个

期刊

浅埋矿床条带法地表沉降开采强度shallow deposits strip mining ground settlementmining intensi

基于FTA的高峰矿玻璃钢锚杆支护系统失效因素分析

针对玻璃钢锚杆在高峰矿-152m平巷支护中的失效问题,运用事故树分析法从地质条件、支护方案设计、支护施工技术水平和管理水平4个方面分析了该巷道中可能导致玻璃钢锚杆支护

期刊

玻璃钢锚杆失效支护系统事故树分析权重GFRP bolt failure supporting system fault tree analysis

基于机器学习的扫描图书元数据自动抽取研究

其他学术论文