论文部分内容阅读
在十九大报告中强调要坚定实施创新驱动发展战略,加快建设创新型国家,而作为集经济性、法律性以及技术性为一体的专利文献是实现创新驱动战略的重要支撑之一,另外,专利是先进科技信息的承载体,因此对于专利信息的分析是国家和企业实施创新驱动发展的第一助力,有利于国家和企业不断提高自身“软件”实力和创新能力,以及进行产业布局和技术管理。但随着海量的专利数据的出现,如何从中快速识别核心技术和新兴技术是国家和企业急需解决的问题。本文基于引文网络分别从核心技术领域识别、核心专利识别以及新兴领域发现进行专利自动推荐关键技术研究。首先将专利按照IPC分类号的部进行划分,获得技术领域之间的有向连接图,然后计算各领域内所含专利的被引次数之和作为权威因子矩阵,同时计算各领域在引用网络中的中介中心性构建中介因子矩阵,最后将这两个矩阵带入Page Rank算法中,获得核心技术领域识别算法即PBR算法。其次,本文基于Page Rank算法,考虑专利的连接属性(被引次数、专利年龄)和自身属性(同族专利数量、权利要求数量),引入了入度占比因子、时间因子、同族专利因子和权利因子,提出了改进的Page Rank算法即PPR算法。最后,本文将有向引文网络进行转换,构建无向带权共引网络,然后在LFM算法的基础上,结合冗余度检测函数和无向PRcen算法,以及对“孤立节点”按照归属度进行分配的处理方法,最终得到新兴领域的发现算法即PLFM算法。为了验证所提出的算法的合理性和优势性,本文选取航空、航天器及设备制造业的专利数据进行实证分析。首先通过比较PBR算法与PR算法的结果排名,发现两种算法具有原理上的一致性,另外相比于PR算法,PBR算法可以更好地识别出核心技术领域和关键技术领域,且具有更高的区分度。其次计算PPR值与被引次数、权利要求数量、同族专利数量和PR值的相关性系数,得到PPR算法和PR算法、被引次数排名是具有一致性的,且PPR算法比PR算法更能识别出高被引专利,相比于被引次数更能识别出关键专利。另外,还从主观角度证明了PPR算法结果更具有合理性。最后按照扩展模块度对LFM算法和PLFM算法、LLCDA算法进行对比,发现PLFM算法的结果要优于LFM和LLCDA算法,且降低了随机性,另外,通过对社区聚类结果的详细分析,证明PLFM算法改善了LFM算法存在的过度重叠和无限循环的问题。