论文部分内容阅读
在分析技术层面专利组合分析方法的基础上,对技术层面专利组合分析方法进行优化.以某生物制药企业专利数据为例,采用文本挖掘技术,通过技术领域标签抽取、专利文本特征表示、专利文本聚类等流程,对专利文本所属技术领域进行划分.采用层次聚类算法中自底向上的凝聚方法,开始将每项专利作为单独的一个组,逐次合并相近的专利对象或专利组,直到所有的专利组合并为一个组,最后利用层次聚类谱系图将聚类过程及聚类结果表示出来。从层次聚类谱系图中可以看到专利文本被聚类成若干专利组团,每个组团即可代表一种技术领域,利用层次聚类谱系图可以更加科学客观的将专利划分为若干技术领域。解决了原专利组合分析方法中由于利用IPC号和专家访谈法作为技术领域的划分方法容易出现偏差的缺点.