【摘 要】
:
近年来基于OA(Open Access开放存取)的信息资源品种数量越来越多,但是我们发现OA信息资源在高校图书馆和一些资源整合平台上存在学科分类简化单一,整合率不完善的状况。导致
论文部分内容阅读
近年来基于OA(Open Access开放存取)的信息资源品种数量越来越多,但是我们发现OA信息资源在高校图书馆和一些资源整合平台上存在学科分类简化单一,整合率不完善的状况。导致用户在查找OA信息资源时,很难准确定位和精确地找到自己所需的学科资源。因此,选择科学有效的分类方法以实现OA信息资源的快速检索、准确定位在OA信息资源利用过程中显得至关重要。依托深度学习在文本分类领域的应用发展,本文选择深度学习的卷积神经网络作为O A信息资源分类改进的技术基础开展相关研究,实现借助人工智能的分类方式,为OA信息资源服务平台的信息处理人员提供一种新的学科分类思路,进而帮助用户更快速和精确地获取基于OA的相关信息资源,提升检索效率。本文首先将汉语主题词表学科分类作为OA信息资源的学科分类的参考,辅助OA信息资源实现更多的学科精确分类,通过学科最终分类确定关键字在平台上获取OA信息资源,对获取到的OA信息资源进行处理,最终得到OA信息资源的数据集。接下来对OA信息资源数据集进行文本预处理,利用我们构建的卷积神经网络模型结构实现对OA信息资源实现自动分类,观察卷积神经网络对OA信息资源的准确度,结果发现卷积神经网络对OA信息资源的文本分类是比较理想和适用的。由于OA信息资源在各学科下的文本数目不一致,分别选取十个学科下文本数目分布均匀和分布不均匀的OA信息资源数据集,利用卷积神经网络实现分类准确度,最终发现均匀分布的OA信息资源数据集比不均匀分布的OA信息资源数据集的分类效果好。最后提出基于原先设计的卷积神经网络,在网络结构、卷积核尺寸和卷积核个数三个方面改变卷积神经网络的结构,观察改变后不同卷积神经网络模型结构对OA信息资源文本分类的影响。实验结果显示改变卷积神经网络的结构,卷积核层数有两层的卷积神经网络对OA信息资源文本的分类效果较好;改变卷积神经网络的卷积核尺寸,卷积核尺寸为(2,3,4,5)的卷积神经网络对OA信息资源的分类效果会相对提高;改变卷积神经网络的卷积核个数,卷积核个数为128的卷积神经网络更适用于OA信息资源的文本分类。本文提出的基于深度学习的OA信息资源文本分类能够给科研人员提供更优质的OA信息资源信息服务。
其他文献
随着数据自动采集技术的迅猛发展,大数据的概念已被广泛接受,传统的统计方法面临挑战。如在医学的基因数据分析中,样本可能只有几百人,而基因数量可能达到成千上万个,或数据中的噪声较多,掺杂着许多与响应变量无关的解释变量,因此希望实现变量选择而降维。基于惩罚函数的变量选择方法是一种处理高维数据常用的方法,分为三类:单变量选择、组变量选择和双层变量选择,本文主要研究基于惩罚函数的变量选择在不同线性模型、不同
近年来,随着互联网技术和全球定位技术的发展,最近邻查询广泛应用于位置信息检索,在图像检索、数据处理、模式识别以及机器学习等领域也都具有非常重要的意义。已有的查询方
由于具有发光颜色可调、色纯度高、荧光效率高、可溶液制备和稳定性好等优异特性,量子点被广泛应用于开发新一代发光二极管。蓝光量子点及其发光器件的研究对白光照明和RGB全
液晶显示器由于其轻薄、功耗低、稳定性强等优势,被应用于诸多行业,其中就包括机载显示,但是由于机载显示器的工作环境极为苛刻,尤其是在剧烈的振动环境下容易出现漏光现象,
近年来,工业设备兴起小型化、集成化的浪潮。小型控制设备尤其是手持云台和无人航拍器得到了高速发展。这些小型控制设备的发展离不开位置传感器。常用的位置传感器包括多极
目的:比较不同种属抗人淋巴细胞球蛋白(ALG)/抗人胸腺细胞球蛋白(ATG)治疗重型再生障碍性贫血(SAA)的有效性及安全性。方法:对2006年1月至2018年6月在华中科技大学同济医学院附属协和医院接受ALG/ATG治疗的71例(猪ALG组37例,兔ATG组34例)SAA患者进行回顾性比较分析,组间比较两组患者经ALG/ATG治疗后不同阶段的血液学应答、药物副作用、总生存率等,并分析各因素对两组
随着全世界人口的快速增长和经济的急速发展,人类发展对环境造成的污染以及可利用能源的匮乏等问题正在日益凸显,作为可以利用地下浅层地热资源完成采暖、制冷和制备生活热水
目的:首先分析CXCL17在胃癌及癌旁正常胃组织中表达情况,统计其差异表达与胃癌患者预后的关系,然后研究体外细胞实验中CXCL17与胃癌细胞增殖能力的关系,以说明CXCL17表达与胃
随着网络的快速发展,传统网络灵活度低,已经不能够满足当前的需求。近些年来,软件定义网络(Software-defined Network,SDN)受到了广泛关注,并且得到了快速发展。SDN是一种新
二维不规则样件的排样优化是典型的组合优化问题,具有广泛的应用意义。多年来,国内外学者对此问题作了大量研究,针对相关行业需求而开发设计的系统和软件亦出现有效成品。利