【摘 要】
:
随着科学技术发展和科学研究领域的急速扩大,促使新研究成果及发明创造不断涌现,主要表现在研究型文献涌现。对专利以及专利与论文之间的引用关系的研究,可以较好的预测技术
论文部分内容阅读
随着科学技术发展和科学研究领域的急速扩大,促使新研究成果及发明创造不断涌现,主要表现在研究型文献涌现。对专利以及专利与论文之间的引用关系的研究,可以较好的预测技术的发展方向,对工业界的发展有重要指导意义,专利检索就变得尤其重要,专利检索为推动专利转化做出了不朽的贡献。对专利内容分析,利用现有文本分析技术来解析专利研究领域和关键内容,成为必要的研究工作。本文首先分析专利的研究现状和背景,由于专利数量众多,对它的下载分析可以采用Hadoop里的MapReduce框架来实现,大大提高了效率,文中以倒排索引为例对MapReduce程序进行深入研究,并初步探讨了非关系型数据库Hbase的存储机制。然后对文本聚类体系结构进行分析,包括文本预处理、文本特征提取、文本相似度计算,研究了文本聚类算法,主要是层次聚类算法和分割聚类算法,对它们进行比较分析。这里提出了一种对文本相似度计算的改进方法,主要是把特征词在文本中的覆盖度引入计算公式,较好的处理了那些特征词权重高但文本覆盖率低导致相似度很高的情况。专利价值分析前,考虑到专利文本的特殊性,以专利标题和专利摘要作为原始文本,通过下载和解析专利来得到初始的文本,再对它进行文本预处理、特征提取、计算类别中心向量以进行聚类分析。对实验结果进行分析总结,现在由专利引发的争端越来越多以及近年来专利转让越来越普遍,企业逐步开始重视专利价值。最后初步实现了专利地图的制作,通过构建专利地图可以方便地为我们提供某个领域的专利情况,使得人们可以全面地了解技术领域相关专利情况,以进行专利价值的分析。
其他文献
根据对国内外瓷绝缘子强度和瓷材料强度的分析,以及超高压输变电工发展对瓷绝缘子的强度要求,提出了我国瓷材料种类和强度水平的发展意见。
《国内安全保卫学》教学具有的实践性强和教学内容保密的特点,决定了教学采用多媒体技术的必要性。通过比较众多的多媒体集成软件,用Authorware制作是较为理想的。脚本的编写应
针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能.采用了三种
也许从大的趋势来看,中国影视业即将迎来了纪录片的春天。纪录片在大片崛起和政府政策扶持下,从数量到质量,从央视纪录频道到各大卫视以及观众的培育,出现从未有过的繁荣,特
<正>写作能力是语文素养的综合体现,但在初中生的实际写作过程中,往往出现很多问题,本文试对初中生在写作过程的前、中、后三个阶段常常会出现的问题进行分析,并提出一些解决
经济学理论认为,一个国家一般由三个部门负责调控全社会的收支平衡,支撑整个国家的稳定和发展。三个部门包括:政府部门,又称第一部门,即一个国家内所有政府机构的总和;企业界私
随着物联网(Internet of Things,IoT)技术的发展,实际应用中对位置信息的要求越来越高。无线传感网络(Wireless Sensor Network,WSN)作为一种应用前景十分广泛的网络技术,已经被应用在国防安全、数据测控、智能应用等领域。在实际应用中,节点定位技术是WSN众多应用的前提和基础。节点在确定自身位置信息后,本身所携带的数据才能发挥最大的应用价值。基于测距(Rang
本研究采用文献学的研究方法,考证“傅山生化汤”的渊源。对《傅青主女科》以及清代妇科专著中有关“生化汤”组方、主病、主证等资料进行搜集、整理,确定处方中各种药物的使用
作为中国传统陶瓷装饰艺术一支的粉彩艺术,以其粉润清秀、色彩绚丽、画工精细、俊雅秀美的独特风貌而享誉海内外,受到人们的普遍欢迎。随着时代的变迁、科学技术的发展,以及