面向HPC领域的知识图谱构建研究与应用

来源 :西北大学 | 被引量 : 0次 | 上传用户:jiaozhixuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算(High Performance Computing,HPC)是国之重器,HPC相关技术是国家发展的战略性制高点技术和核心竞争力,涉及硬件、基础软件、应用软件等多个领域。作为执行复杂计算的基础,HPC通过数据计算推动数据科学和工业社会发展。然而,现有的HPC人才数量难以支撑迅猛增长的应用需求。同时,HPC强调实践性,要求很高的互动性,HPC学习者需要优质的学习途径和方法来完成学习活动,保证所学HPC知识与领域知识融会贯通,提高自身的HPC专业能力。再者,HPC横跨多个学科和领域,不但专业性强而且复杂度高,传统的题库学习方式成本高昂。因此需要一种高效、低成本的方式去梳理HPC知识的学习脉络,评价HPC实践活动的实际效果。本文通过“AI+教育”的方式去构建HPC学科类和领域类知识图谱,通过图谱对HPC领域中的实体、概念、属性以及对象间的关系进行建模,用智能化的方式将散列各处的HPC内容汇集到知识图谱中,为学员提供一种个性化的知识点式学习途径和学习效果评估方法。对于HPC知识图谱构建任务,仍存在三个挑战:1)针对HPC实体抽取任务,大量的实体概念隐藏在非结构化数据中,涉及数据标注的提取方式耗时费力,且HPC涉及的领域和学科较多,需要在短时间内提取各领域和学科的关键知识点;2)针对HPC关系抽取任务,因图谱是面向HPC教育平台所构建,所以知识点间的关系需要精准且有学习关联意义,本文要求快速抽取出实体间的多重内在语义联系;3)针对抽取出的知识数据,知识条目需与学科强相关,对于每个领域和课程的知识图谱构建,抽取出的实体对象和关系存在过溢、低权值、重要度不匹配的问题,图谱数据需要进一步优化。为解决上述挑战,本文的主要工作包括:1)提出一种针对特定领域下,融合迭代频率特征统计提取模型、语义特征提取模型的实体抽取框架。通过将基于“N-gram”的动态实体扩充策略与词向量语义特征相结合进行实体提取,利用这种联合语义特征的统计提取方法,能够快速地提取目标概念和部分关系信息;2)提出了一种多特征联合模板关系提取策略。设计共现频率提取方法,并将频率关系与近义关系结合作为粗粒度关系,然后通过基于Snowball的关系挖掘算法挖掘细粒度三元组关系,并与粗粒度关系整合后作为图谱关系基础,结合两者来共同反映HPC知识的关系特征;3)提出一种HPC知识图谱优化算法,包括HPC实体聚类设计、基于LDA的知识加权策略、基于图团体检测的知识裁剪策略。此外,本文设计了基于知识图谱的学科实践评估和学习资源推荐算法,实现个性化推荐和学习状态评估。最后,构建相关应用系统,将图谱数据进行java可视化控件移植。为了验证应用效果,采取人工抽样评估方式进行综合评测。
其他文献
从1984年下半年开始,我国经济运行中出现了经济过热的现象,主要表现在货币投放过多,消费基金增长过快,固定资产投资过多,通货膨胀加剧等问题。1988年中央又决定对物价进行改革,由于改革时机不恰当,发生了抢购风潮,经济秩序出现混乱,于是中央决定对国民经济进行治理整顿。治理整顿历经1988年到1991年三年时间,大致可以分为三个阶段:第一阶段大致从1988年8月底到1989年8月,主要任务在于压缩社会
学位
我国于2008年通过《中华人民共和国禁毒法》确认了社区戒毒的法律依据,也将社区戒毒确定为戒毒的“主要阵地”。虽然政府对社区戒毒群体社会治理力度加大,但是该群体的社会融入情况却没有较大的改善,有的甚至存在复吸问题。随着近年来戒毒人员数量的不断攀升,对该群体社会融入的问题的研究是彰显地方政府社会治理体系和治理能力现代化的重要方面。本文运用质性研究方法,对20名社区戒毒人员社会融入的历程进行分析。立足于
学位
1目的评价针刺“睡眠组穴”治疗痰热内扰型失眠的疗效。2方法采取前瞻性随机对照的试验方法,将纳入的72例失眠患者随机分为试验组和对照组,每组36例。试验组针刺选穴为“睡眠组穴”(阳陵泉、足三里、上巨虚、丰隆、公孙、中脘),对照组采用“十三五”国家规划教材《针灸学》中不寐的穴位处方(百会、神门、三阴交、照海、申脉、安眠、厉兑)。每周行3次针刺治疗,每次治疗30分钟,连续治疗4周。治疗前后分别以匹兹堡睡
学位
1940年代,沈从文在创作数量、思考方式以及精神状态等方面都发生转变。受布迪厄场域理论的启发,本文将沈从文的文学创作及心理动态放置在以地理坐标昆明为中心的文学场内进行考察。结合政治、教育、美学等多个子场域的交叉与碰撞,试图回到历史现场。发掘沈从文转折期前后精神世界的“常”与“变”。第一章立足1940年代的抗战文化语境,剖析昆明文学场在政治、经济、教育等子场域的共同作用下的逐渐生成。研究时先以该时期
学位
在新中国实现农业集体化后,毛泽东曾提出“农业的根本出路在于机械化”的著名论断。在农业领域,农业机械化一直是作为中共中央的一件大事来抓的。历史地看,新中国农业机械化事业的发展历程可谓曲折,特别是在经过“大跃进”运动造成的无序以及艰难的调整恢复之后,毛泽东在1966年公开提出“15年基本上实现农业机械化”的目标,推动农机化群众热潮再次涨起,在新中国农机化历史上留下了浓墨重彩的一笔。直到1980年中央公
学位
在新冠疫情肆虐全球背景下,我国经济下行压力的持续增加,导致国内企业逐步将发展重点放在基本运营、主要产品研发等方面。但一味的追求经济效益,忽视生态环境效益,会使企业无法实现可持续发展的目标。因此,像煤炭等污染型企业,更要主动承担起保护生态环境的社会责任,通过环境成本控制谋求以最少的环境成本投入,达到提高企业经济效益、降低环境成本总额、减少生态环境破坏的目的。本文通过梳理国内外文献,以可持续发展理论、
学位
2019年末新冠肺炎疫情出现,在病毒不断变异和快速传播的情况下,政府不得不采取了一定的管控措施,包括交通管制、小区封闭、集中隔离等措施,对我国各行业产生了不同深度的影响。其中职业教育担当着为社会提供优秀技能人才的重任,对稳定经济和就业起着关键作用。因此疫情的发生是否对职业教育行业造成严重影响值得探究。本文采用事件分析法,以职业教育板块30家公司为样本,以沪深300指数为市场参照进行研究。首先,挑选
学位
网络主权是中国关于网络空间全球治理和网络空间国际规则的核心主张,但网络主权理念与长期以来西方主导的“网络空间无主权”网络空间“全球公域说”相违背,网络主权仍受到来自国际社会的质疑。本文从当下网络空间存在问题出发,讨论确立网络主权的重要意义,并以《网络国际行动塔林手册2.0》作为参考,进行网络主权的效力边界研究。网络主权是国家主权在网络时代的发展,是国家主权在网络空间的表现形式,本质上属于国家主权的
学位
随着云计算的快速发展,用户群体越来越庞大,各种各样的用户需求给云计算系统带来了巨大的挑战。一个合理、高效的云计算资源调度算法不仅可以保证云计算环境的稳定运行,还可以在一定程度上提高用户体验感,减少调度任务完成总时间,使调度过程变得更加高效。本文研究了云计算环境下的资源调度问题,以减少任务完成总时间为优化目标,针对蝙蝠算法在求解调度问题的过程中存在收敛效率差、求解精度低以及难于摆脱局部约束等缺点进行
学位
研究目的:在人际交往时,正确理解面部表情传递的情绪信息十分重要,情绪面孔识别能力受损与社交焦虑症状及校园霸凌现象存在联系。在焦虑症、咖啡因成瘾、智能手机成瘾等一系列因素的影响下,睡眠质量低下与睡眠剥夺现象在人群中广泛存在。过往的大脑机制研究提示睡眠问题与情绪面孔识别之间可能存在联系,然而关于睡眠问题对情绪面孔识别能力的影响,研究相对较少且结果存在争议。因此,本研究计划探索睡眠质量低下及睡眠剥夺对情
学位