融合表示学习与专利文本表征的新兴技术预测

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:pmlypmly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
技术创新是推动经济社会发展的核心力量。针对新形势新特点,抢抓时机攻破核心技术以此来发挥技术创新的推动引领作用,是关乎国家长远发展的重大问题。新兴技术可以看作是技术创新的成果,它触发了技术的变革,不仅给人类社会带来了巨大的变化,而且在改变传统产业形态的同时创造了大量新兴产业。因此,预测和发现新兴技术显得至关重要。当前新兴技术预测研究大多基于专利文本以及新兴技术的外部特征展开,而根据新兴技术产生模式研究可知,新兴技术产生于渐进性创新过程中,可以看作多个不同领域技术的融合,因此,从技术融合的角度来预测新兴技术是符合新兴技术产生模式的,但目前从技术融合的角度预测新兴技术的研究较少。当前的技术融合研究大多基于专利共类分析法构建专利共类网络,并采用传统网络指标以及这些指标的混合运算和改进运算进行网络分析,这些指标难以准确地表示完整的网络结构信息,计算复杂度也会随数据集规模增大而大幅度增长。本文将新兴技术预测问题转化为链路预测问题,首先,提出了一种基于专利共类网络表示的链路预测模型(Link Prediction Based on Patent Co-classification Network Representation,LPPCNR),该模型基于IPC分类号的共现关系构建专利共类网络,利用网络表示学习模型学习网络拓扑结构信息,并通过机器学习方法预测新兴技术;其次,更进一步考虑,由于专利文本中隐含着能反映技术主题的重要知识,目前尚无研究将专利共类网络中的IPC节点包含的网络特征和专利文本特征进行融合,为此,本文将专利共类网络表示与专利文本表示进行融合以预测新兴技术。为了探究最佳融合方式以提高新兴技术预测效果,提出了基于浅层融合的链路预测模型(Link Prediction with Early Fusion,LPEF)和基于卷积神经网络的深度融合预测模型(Convolutional Neural Networks with Deep Fusion,CNNDF)。LPEF模型采用浅层融合方式将节点网络表示与专利文本表示进行直接拼接和线性融合,CNNDF模型基于卷积神经网络对节点的网络表示和专利文本表示进行深度非线性融合。其中,对没有产生连接的IPC节点对进行专利文本表征这一难题,提出了IPC节点专利文本表征生成算法;最后,在华为专利数据集上进行多组对比实验,结果表明,本文提出的融合表示学习与专利文本表征的新兴技术预测模型能显著提升新兴技术的预测效果。
其他文献
现代社会“高空抛物”事件频发,由于其具有不可预测性、后果严重性等特征,严重扰乱了社会生活的安宁,为了更好的实现刑法的安全保障功能,《刑法修正案(十一)》中单独设立高空抛物罪,这是总体国家安全观下积极预防犯罪的表现。通过刑事处罚的严厉性倒逼个人行为规范化,在犯罪圈扩大化的同时也存在对自由的过度介入,适用不当会造成人权风险。为了正确适用高空抛物罪,合理保护高空抛物罪的法益,避免刑法处罚范围的不当扩大造
学位
人脸检测和识别系统被广泛应用于交通、门禁等各种生活场景。随着新冠疫情的爆发,在公共场所佩戴口罩成为了各国防疫的一项重要措施。然而口罩会遮挡较大的人脸区域,使人脸检测和识别算法难以捕捉到足够的人脸信息,从而导致算法识别准确率下降乃至无法正常工作。通用人脸检测算法针对的是常见场景,在特殊场景下往往需要针对特定的问题对算法进行调整。目前针对口罩遮挡场景的人脸检测研究较少,而现有人脸检测算法在口罩遮挡场景
学位
近年快速发展的工业化和城市化加剧了城市的空气污染问题,包括雾霾在内的空气污染公害越来越频繁,大气颗粒物引起了更多的关注,其携带着大量有毒和危险化学物质,并在空气中进行长久、大范围的扩散转移,对人类生命健康和空气质量有着显著的影响,大气颗粒物所含的对生态环境和人体健康有害的重金属成分也成为研究重点。面对实际环境问题和潜在受体人群呼吸暴露现状特征,开展青山区大气颗粒物的健康风险研究,对解析雾霾造成的健
学位
微塑料广泛存在于土壤环境中,在世界范围内受到越来越多的关注,我国不同地域土壤中也检出微塑料。同时,农业土壤重金属污染已成为全球普遍存在的环境问题。镉(Cd)作为土壤中毒性最大的微量元素之一,很容易被作物吸收并转移到地上部位,然后通过食物链对人类健康构成严重威胁。重金属进入土壤后,或在土壤溶液中以离子状态存在,或通过吸附、沉淀、络合等方式在土壤矿物、有机质、微生物及其相关络合物的表面被固定。这一老化
学位
群智感知是将众包思想和移动设备感知能力相结合的一种新的数据获取模式,可以完成大规模且复杂的感知数据收集任务。在实际应用中,由于种种原因,参与群智感知任务的用户可能无法向服务器提供真实准确的感知数据。错误数据的提交会导致数据冲突。真值发现方法的提出是为了从数据冲突中得到真实数据(即真值)。目前真值发现机制已经被广泛应用于群智感知系统以提高数据聚合的准确性。同时,在某些群智感知应用中,感知数据涉及到用
学位
近年来,随着人工智能技术大幅度的发展,人工智能技术已经被应用到了各个领域,其中就包括任务型对话系统。任务型对话系统为人们的日常生活带来了便利,如现在很多电商平台都使用智能客服帮助用户解决各种问题。但随着任务场景覆盖面越来越广,任务型对话系统也面临着越来越多的挑战。对话语言理解模块是任务型对话系统中最为重要的组成部分,因此对于对话语言理解任务的研究是提升任务型对话系统效果的关键。目前的对话语言理解任
学位
信息技术的发展给统计学和信号处理等领域带来了高维数据,稀疏恢复问题也由此备受关注。在高维数据的研究过程中,稀疏性经常能起到重要作用。在统计领域,稀疏性影响线性回归模型的可解释性。在信号处理领域,压缩感知模型中原始信号的稀疏性能够减少所需的采样数据。组稀疏是指非零系数集中出现在某些组中,为了充分利用组稀疏这一结构先验,基于组稀疏恢复的各类模型应运而生。在高维线性回归模型中,组稀疏恢复的做法是在原有线
学位
自21世纪以来,在全球范围内接连暴发了多起突发公共卫生事件,2019年底“新冠肺炎”(COVID-19)疫情的暴发,更是一起传播范围广、感染速度快且防疫难度大的卫生事件,对中国经济的高质量发展带来了严峻的挑战。股市历来被视为宏观经济“晴雨表”,疫情对于国内经济的冲击也很快地反应到股市中。2020年2月3日国内股市恢复开市后,当日股市收益暴跌,基于行为金融学理论及我国股市以散户为主的市场现状,投资者
学位
矿产伴生的硫铁矿在开采、加工和堆放等过程中,容易与氧气、水和微生物接触发生自然浸出作用,进而产生pH值极低、含有大量SO42-、Fe2+、Fe3+和其他污染离子(如Cu2+、Ag+、As O33-等)的酸性矿山废水(简称AMD)。AMD未经处理直接排入水体,对周边环境及生物生存危害极高,如何实现AMD的有效处理成为国内外众多学者的研究热点。由嗜酸性氧化亚铁硫杆菌(A.ferrooxidans)催化
学位
我国是化工生产大国,众多化工品产能居世界第一,为工业生产、交通运输、建筑施工等其他行业的发展提供了重要支撑。然而,化工生产给我国经济社会发展提供强劲动力的同时,也带来了许多安全问题。爆炸事故是化工生产企业最常发生的事故,在国家持续开展各种形式专项整治行动的情况下,爆炸事故仍时有发生,造成了巨大的伤亡损失,影响着化工生产企业的稳健发展。对化工生产企业爆炸事故历史经验教训的研究不够深入,没有充分挖掘历
学位