基于引文网络的专利自动推荐关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xiyouyou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在十九大报告中强调要坚定实施创新驱动发展战略,加快建设创新型国家,而作为集经济性、法律性以及技术性为一体的专利文献是实现创新驱动战略的重要支撑之一,另外,专利是先进科技信息的承载体,因此对于专利信息的分析是国家和企业实施创新驱动发展的第一助力,有利于国家和企业不断提高自身“软件”实力和创新能力,以及进行产业布局和技术管理。但随着海量的专利数据的出现,如何从中快速识别核心技术和新兴技术是国家和企业急需解决的问题。本文基于引文网络分别从核心技术领域识别、核心专利识别以及新兴领域发现进行专利自动推荐关键技术研究。首先将专利按照IPC分类号的部进行划分,获得技术领域之间的有向连接图,然后计算各领域内所含专利的被引次数之和作为权威因子矩阵,同时计算各领域在引用网络中的中介中心性构建中介因子矩阵,最后将这两个矩阵带入Page Rank算法中,获得核心技术领域识别算法即PBR算法。其次,本文基于Page Rank算法,考虑专利的连接属性(被引次数、专利年龄)和自身属性(同族专利数量、权利要求数量),引入了入度占比因子、时间因子、同族专利因子和权利因子,提出了改进的Page Rank算法即PPR算法。最后,本文将有向引文网络进行转换,构建无向带权共引网络,然后在LFM算法的基础上,结合冗余度检测函数和无向PRcen算法,以及对“孤立节点”按照归属度进行分配的处理方法,最终得到新兴领域的发现算法即PLFM算法。为了验证所提出的算法的合理性和优势性,本文选取航空、航天器及设备制造业的专利数据进行实证分析。首先通过比较PBR算法与PR算法的结果排名,发现两种算法具有原理上的一致性,另外相比于PR算法,PBR算法可以更好地识别出核心技术领域和关键技术领域,且具有更高的区分度。其次计算PPR值与被引次数、权利要求数量、同族专利数量和PR值的相关性系数,得到PPR算法和PR算法、被引次数排名是具有一致性的,且PPR算法比PR算法更能识别出高被引专利,相比于被引次数更能识别出关键专利。另外,还从主观角度证明了PPR算法结果更具有合理性。最后按照扩展模块度对LFM算法和PLFM算法、LLCDA算法进行对比,发现PLFM算法的结果要优于LFM和LLCDA算法,且降低了随机性,另外,通过对社区聚类结果的详细分析,证明PLFM算法改善了LFM算法存在的过度重叠和无限循环的问题。
其他文献
在对股权分置进行改革之后,出现了上市公司定向增发这种新型的再融资工具,因为其门槛以及发行成本都相对较低,使得2006年之后的这十几年时间里,这种模式就已经打破了已有的由
随着网上购物的普及和电子商务的飞速发展,在进入21世纪后,我国网购用户规模在持续增长,据统计中国的网购用户规模早已突破5亿人,然而随着用户量的不断增长,对电商系统的访问
科学学是研究科学的科学,它旨在理解、量化和预测科学研究及其产生的结果和影响。科学学揭示了科学和科学活动发展规律,并将这些规律应用于促进科学的发展,辅助科学发展战略
醌类衍生物作为有机化学中历史悠久的氧化还原物质,被开发应用于多个研究领域,例如C-H活化反应、药物化学、天然产物、染料与配体合成等方向。因其空间结构的电子特性,醌类化
近几年,我国企业资产证券化发展迅猛,目前已成为国内资产证券化市场占比最大的种类,截至2019年末占比47%,发行规模高达1.11万亿元。企业融资难、融资贵是当前国内较为突出的
土壤微生物在维持生态系统功能和稳定性方面发挥着关键作用,并且对环境变化有较高的敏感性,细菌在微生物类群中丰富度最高。本研究采用高通量测序的方法,研究了喀斯特地区不同人为干扰强度对块状土壤和岩土界面土壤的细菌群落及相互作用的影响,根据不同的干扰强度选择了原生林、次生林、弃耕和耕地4种土地利用方式。结果表明:(1)随着人为干扰强度的增加,土壤有机碳(SOC)、全氮(TN)、镁(Mg)、铝(Al)含量和
目的:考察江苏唐氏综合征产前筛查指标AFP和hCG的MoM值的正态性,探索Johnson分布体系中的 SL分布族在上述指标正态性转换中应用的可行性和有效性。方法:资料来自于江苏省出生
皮革制品是人类发展史上重要的生产生活工具,我国古代很早就对动物皮革进行了开发利用,皮革文物蕴含着丰富的历史信息,是我国文物的重要组成部分。皮革主要由蛋白质、脂肪和
Nimble Cloning是一项新型的分子克隆技术,具有操作简单、使用灵活、克隆效率高、标准化克隆等优点。但Nimble Cloning需要使用配套的表达载体。本研究对pDOE系列的植物BiFC