基于深度语义学习的专利挖掘方法及应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:yishu888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当下社会进入了前所未有的高速发展期,科技创新活动呈井喷趋势增长,成为推动国家经济增长和提升国家竞争力的第一动力。专利文献由于囊括了全球每年90%~95%的最新科技成果,是蕴含技术创新方案的重要知识载体,因此基于专利数据从海量的信息中挖掘出与技术相关的情报信息,可以为企业和国家制定创新发展战略提供帮助。传统的专利分析研究多使用计量统计的方法,忽略了文本中隐藏的重要信息,而近些年兴起的专利文本挖掘研究中,则存在专利文本特征提取不完整、未充分考虑文本中语义关联等问题,不能对专利文献进行深度的分析。基于以上原因,本文以专利文本为挖掘对象,考虑了专利的语义和文本特征,分别从特征提取和专利文本向量表示两个方面,提出了适用于专利领域的文本挖掘方法。其中,在特征提取上,本文选择SAO-C(Subject,Action,Object,Complement)结构作为专利的技术特征,并针对专利文本特有的语言特点,以及现有方法在提取专利领域SAO-C结构上的不足,提出了基于深度学习的SAO-C结构提取模型:Ro BERTa+BiLSTM+MLP,并充分利用大型公开数据集和部分标注的专利数据作为训练集,提高了模型的泛化能力,实现了良好的领域迁移效果。而在专利文本向量表示上,创新性提出了Doc-SAO模型,通过使用SAO-C结构向量和标题向量分别对专利文本向量进行进一步的增强和补充更新,既保留了原始文本的语义信息,又突出强调了专利SAO-C中所蕴含的重要技术信息,最终获得了包含丰富语义信息的专利文本表示。实验结果证明,以上深度学习模型在专利领域的文本挖掘任务中均具有相对优势。接着,基于获得的专利文本向量,可以计算专利的相似度矩阵,进而构建专利网络和专利地图等知识图谱。其中,在专利网络中,通过提出的核心专利识别指标体系,可以识别出重要的核心技术以及技术的整体演化过程;在专利地图中,通过对专利技术空位的异常专利进行筛选、梳理和总结,可对技术未来的发展做出合理的预见。最后,将以上提出的专利挖掘方法运用到人工智能领域,对该领域中的核心专利、技术演化、专利权人合作情况、技术的未来发展趋势做了系统的分析,研究结果可以为人工智能产业的创新发展作出规划指导。
其他文献
研究相温贮藏对黄花菜表面微生物种群结构的影响,为黄花菜保鲜提供参考。将采自甘肃庆阳的黄花菜分组包装后分别放入冰箱(4℃±1℃)、冷库(0℃±0.5℃)及相温环境(-0.5℃±0.1℃)中贮藏,7 d时测褐变率,并提取表面微生物样本,利用特异性的引物分别对细菌宏基因组16S r RNA的V3-V4区和真菌宏基因组ITS1-1F区进行PCR扩增,基于Illumina高通量测序技术分析黄花菜微生物相对丰
期刊
“我们要建设的社会主义现代化强国,不仅要在物质上强,更要在精神上强。”公德是我国社会主义精神文明建设的重要内容,公德水平的高低既体现了个人道德修养又展现了社会文明风尚。随着我国社会主义市场经济体制的逐步完善和社会主义现代化建设的日益加快,公共事务日益增多、公共交往日益活跃、公共生活空间不断扩展,在客观上提出了深化和创新公德发展的时代要求。研究发现,目前公德理论研究与其现实发展并不同步,具体表现之一
学位
暴露于2008年国际金融危机,国际贸易具有过度依赖于美元进行交易结算的特征。这一特征存在的显著风险把人民币国际化从民间诉求推至国家战略:中国于2009年启动跨境贸易人民币结算试点。然而与美元、欧元等在国际贸易中使用频率较高的结算货币相比,跨境贸易结算中的人民币根植于中国体制转型和经济转轨环境,更容易受到资本账户尚不可自由兑换、国内金融市场不够完善等既有制度环境的约束。值得关注的是,在中国体制转型和
学位
随着消费升级,消费者对个性化定制产品需求越来越大,推动企业关注“货”为核心转向关注“人”为核心,C2M模式成为企业满足用户个性化需求的一种主要商业模式。一方面,在实际的运营决策过程中,设计商成为个性化定制供应链独立决策成员,并且不同主体主导的权力结构供应链成员彼此之间存在利益冲突,影响个性化定制产品供应链定制度、设计创新服务水平、定价决策和整体供应链绩效。另一方面,消费者对于个性化定制产品也有“极
学位
1978年以来,我国对外开放程度日益增加,其后又得益于我国政府对“引进来”和“走出去”战略的积极推进,使得流入我国的外商直接投资(IFDI)和对外直接投资(OFDI)均实现了快速发展。但随着对外开放带动我国经济繁荣的同时,我国碳排放水平也在不断升高,因此关于二者关系问题的研究备受重视。在当前中国兼具全球最大外商直接投资东道国和第二大对外直接投资母国的双重身份背景下,双向FDI对我国碳排放会产生怎样
学位
目的 梳理并展望黄花菜采后贮藏保鲜及其活性成分提取的新技术和新方法,以期为黄花菜产业发展提供理论依据。方法 对近年来黄花菜保鲜贮藏方法进行综述,包括冷藏保鲜、生物化学保鲜和辐射保鲜等,并对黄花菜中的多糖、黄酮、多酚等活性成分的提取方法进行总结。结果 选择适宜的保鲜技术可以在一定程度上延长黄花菜的贮藏期,有助于黄花菜产业健康发展;活性成分提取研究报道主要集中在几种黄酮类与多酚类的成分上,提取技术以微
期刊
由于人工巡检及传统的故障检测存在各种弊端,对于智能化的光伏组件故障检测研究变得越来越迫切。首先,阐述了国内外现有的传统光伏组件故障诊断技术;其次,详细研究了结合智能化的光伏组件故障检测技术,包括基于电气特性和多类别图像的智能故障检测;然后,总结了光伏组件智能化故障检测优缺点;最后,对此领域的未来进行了展望。
期刊
跨国公司在选择海外市场时,需要考虑何种因素,以什么形式对外投资是企业国际化进程的首要问题,也是理论界广泛研究的热点问题。本文则从具体案例出发,研究“一带一路”的标志性项目中欧班列对我国跨国公司海外扩张的影响,分析其对跨国公司实现海外扩张的支持效应。本文通过案例研究的方法,以企业国际化阶段理论、企业的资源基础理论、交易成本理论和供应链优化理论为基础,分析中欧班列(成都)对TCL实施海外扩张战略的影响
学位
2013年9月,“自由贸易试验区”这一伟大战略正式在我国拉开序幕,两年后的4月,在上海自贸区的带头示范下,第二批自贸区挂牌成立。理论上,设立自贸区旨在通过政府职能转化升级、金融领域改革创新、提高贸易和投资的便利化水平等方式促进当地金融、贸易投资等方面的发展,进而促进地区经济增长。我国一系列自贸区的设立是否如理论预期那样促进了经济增长,是否实现了其设立时的定位目标?针对这一问题的已有实证评估稀缺,基
学位
无论是从全球来看,还是从国内市场来看,医药制造业都有着极为广阔的发展前景,而研发创新活动对医药企业的生存和发展起到至关重要的作用。医药制造业研发创新活动往往依赖于政府,长久以来,政府补助与企业绩效之间关系都是学者关注的重点。政府补助能够鼓励企业进行研发创新,但是频频曝光新闻事件中,医药制造业企业净利润中政府补助占比惊人,很多企业纯粹依靠政府补助“输血”来维持“良好”的净利润或者依赖政府补助来减少企
学位