【摘 要】
:
随着中国-东盟互联互通不断深入,中国-东盟学术领域的情感分析研究就显得非常重要,不但在学术课题制定提供了有力支持,而且还为政府分析双边关系、预测机遇和风险等提供了数据上的支撑。但是现有的研究对于中国-东盟学术领域舆情分析展开的较少,因此本文基于CNN、RNN、LSTM等基础算法,结合学术领域文章的语法特点,提出了 AFSAM模型,展开关于中国-东盟学术领域情感分析的研究,不但具有一定的学术意义,而
论文部分内容阅读
随着中国-东盟互联互通不断深入,中国-东盟学术领域的情感分析研究就显得非常重要,不但在学术课题制定提供了有力支持,而且还为政府分析双边关系、预测机遇和风险等提供了数据上的支撑。但是现有的研究对于中国-东盟学术领域舆情分析展开的较少,因此本文基于CNN、RNN、LSTM等基础算法,结合学术领域文章的语法特点,提出了 AFSAM模型,展开关于中国-东盟学术领域情感分析的研究,不但具有一定的学术意义,而且拥有极高的应用价值。首先,通过基于Python的互联网爬虫技术,爬取关于“中国-东盟”的各领域学术论文内容,以学术论文的摘要部分作为主要分析对象;对爬取到的语料进行预处理、进行数据清洗、数据整合、数据标准化、分词、词嵌入等预处理操作。接着,构建了基于深度学习算法的情感分类模型。根据学术文章语料的语法特点,结合CNN的算法,提出了 C-AFSAM模型;由于C-AFSAM核心并不存在对语料时间顺序上信息的提取能力,因此结合RNN算法提出了 R-AFSAM模型;由于学术文章语料长度较长,R-AFSAM模型在长时间的序列上表现不好,于是结合LSTM的细胞结构,提出了 M-AFSAM模型,用于提高模型在处理序列数据时的记忆力。通过试验确定适合各个模型的超参数后,对比实验结果发现,C-AFSAM模型和M-AFSAM模型在准确率、查准率、召回率和F1值方面都有优异的表现。考虑到C-AFSAM模型试验表现不错、运行效率较高;同时M-AFSAM模型的试验表现最好,但M-AFSAM模型运行效率较低、花费时间较长,将两个模型进行融合以获取各自的优点,提出了基于CNN和LSTM的Combined-AFSAM组合模型,通过C-AFSAM模型中的卷积、池化操作对数据进行先期降维、提炼等操作,再由LSTM细胞进行深层次的数据挖掘等工作。通过实验、分析结果后,发现组合模型在准确率、查准率上有一定程度的提升,并且在运行效率上有极大的进步。最后介绍了中国-东盟海洋大数据平台的框架和结构,并将本文研究的学术领域文本分类模型融合到了大数据平台中的学术领域舆情监控模块。
其他文献
气体绝缘开关柜(Gas-Insulated Switchgear,GIS)广泛运用于当代电力系统,其绝缘状况与电网的安全稳定息息相关。局部放电是反映电力设备绝缘缺陷的重要指标,针对局部放电信号的特征学习与模式识别方法的研究具有重要意义。局部放电模式识别任务具有鲜明的特点,例如真实局部放电事故发生概率小,数据难以获得。当前研究主要依靠物理仿真数据,但仿真数据依旧存在样本不足、多样性缺乏等问题。此外,
分布式联合信源信道编码(Distributed Joint Source-Channel Coding,DJSCC)将分布式信源编码(Distributed Source Coding,DSC)技术与信道编码联合起来考虑,同时实现了压缩与抗差错功能,更适合实际的应用场景,深受国内外研究学者们的关注。本论文对基于原模图LDPC码的分布式联合信源信道编译码的关键技术展开研究,具体工作如下:1、针对无记
活性分散染料是解决超临界CO2中天然纤维染色局限性的重要选择之一,积极开发活性分散染料,对于天然纤维的无水染色加工具有重大意义,也符合当今绿色生产的发展要求。活性分散染料发展至今已获得了一定的成效,且对于超临界CO2的广阔应用前景而言,这种特殊结构染料的研发将成为今后该领域的研究热点。为此,本课题设计并合成了偶氮型三原色活性分散染料:活性分散红SCFX-AYRL、活性分散黄SCFX-AYYL和活性
木质纤维素作为环境友好、价格低廉的可再生资源,具有广泛的应用,可以通过化学法或生物法转化为乙醇、乙二醇和糠醛等小分子化合物或转化为汽油、柴油以及航空燃油等高价值燃料,在人类社会能源可持续发展中占有重要的意义。木糖是自然界含量仅次于葡萄糖的第二丰富的糖类物质、在木质纤维素中占有较高的比例、实现木糖的高效转换利用是实现木质纤维素高值化利用的关键因素和前提条件。木糖酸是一种五碳有机酸,应用广泛,可作为螯
制程提高和技术创新为NAND Flash带来了更高的存储密度,但也让其数据可靠性问题日益恶化。其中,耐久度(Endurance)的不确定性及差异性不仅降低了闪存使用寿命,也导致使用者依据远低于最小实际值的标称值而过早地更换闪存设备,造成极大的寿命浪费。若能准确地预测闪存耐久度,即可利用预测结果实施坏块预警和优化磨损均衡策略,这将有效地延长闪存设备使用寿命和避免突发性失效导致的严重损失。为此,提出一
本文主要研究修正导数项的有限体积HWENO(Hermite Weighted Essentially Non-oscillatory)格式,并结合两步四阶时间离散方法,应用于求解双曲守恒律方程。我们研究修正导数项的有限体积HWENO格式,这种格式既有高精度,又具有本质无振荡特性。为了控制解在间断附近的伪振荡,我们首先修正解的一阶导数项。然后,我们使用同一套模板,直接重构解和解的一阶导数项。HWEN
α,β-不饱和醇是香料、药物及一些精细化工产品的重要原料和反应中间体。传统均相体系需要使用价格昂贵的金属氢化物(如NaBH4或LiAlH4)还原α,β-不饱和醛/酮,但存在反应条件苛刻、产物分离和提纯困难等问题。以多相催化选择加氢的方式连续生产α,β-不饱和醇可以带来生产效率、环境友好和经济效益等方面的优势。巴豆醛是一种结构简单的α,β-不饱和醛,C=C键侧仅有一个甲基相连,空间位阻比苯基等长链取
目的:(1)将人角质形成细胞(human epidermal keratinocyte,HEK)与人脐带间充质干细胞条件培养基(Human Umbilical-derived Mesenchymal Stem Cell,HUMSCCM)共培养,探究其能否发生上皮间质样变(Epithelial Mesenchymal Transformation,EMT)样变。(2)探究HUMSC-CM中促进在EM
在违约损害赔偿的体系中,可得利益赔偿是其重要的组成部分,目前,我国《合同法》对可得利益赔偿尚无系统、完善的规制,虽然在该法的第113条规定了对可得利益的保护,并确立了可预见性规则,但是该法规为原则性、指导性的规定,对司法实践来说,其操作性不强。虽然最高人民法院在司法指导意见中,对可得利益的几种类型进行了列举,并规定了可得利益赔偿的基本计算方法,但是,在具体的实践中可操作性不大且无法满足日益增长的可
细胞的生命活动大多以蛋白质相互作用的形式进行,对蛋白质相互作用进行深入研究,有助于人类更深入理解生物体生命活动的机理。当前基于深度学习的蛋白质相互作用预测方法能够克服传统实验方法的缺陷,通过对海量蛋白质数据进行处理和分析,取得不错的效果。然而,这些方法还存在以下不足,主要表现为:特征选取只考虑了蛋白质的序列特征而忽略了其它特征;序列模型训练速度非常慢;缺乏有效的方法基于蛋白质三级结构进行相互作用预