Research on Activation Functions and Understanding Language with Text Classification

来源 :湖南大学 | 被引量 : 0次 | 上传用户：fantasy2204

【摘要】

：

【作者】

：

SAMATIN NJIKAM ABOUBAKAR NASSER

【机构】

：

湖南大学

【出处】

：

湖南大学

【发表日期】

：

2020年期

【关键词】

：

神经网络

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

教计算机"学习"并不像听起来那么遥不可及。计算机如何区分手写数字的图片？或者学习将文字分类？这些事情都可以通过将许多简单的单元串起来，建立起一个学习网络来解决。该研究领域称为“人工神经网络”，它能够解决许多非常复杂的问题，本文研究基于人工神经网络的文本分类问题。
　　本文的第一个贡献是为神经网络引入了一种新颖的激活函数。激活函数是人工神经网络架构的核心，它使人工神经网络能够对输入和响应变量之间的复杂关系进行建模。没有激活函数的神经网络将只是一个线性回归模型，其表现力有限，对于非线性问题的建模能力不足。虽然从理论上讲，激活函数可以是任何可微分的数学运算，但在训练神经网络实际情况中，只出现过少数几个可以很好运行的激活函数。事实上，几十年前，研究者们就已经定义了“理想”激活函数的主要特性，即连续可微分性、非线性、有界(即它应该有一个最小值和最大值)、对称(最好是围绕原点)，这些特性解释了为什么人们起初广泛采用西格和双曲正切函数作为激活函数。然而，最近它们已经不受青睐了，而是被新的激活函数所代替，如整流线性单元(ReLU)和maxout。这些新的函数对于在许多现实世界问题上训练深度神经网络表现出了更好的响应，但它们的设计却忽略了上面提到的关于激活函数的许多主要属性。传统的激活函数对于许多现实世界问题的表现不好，特别是在训练深度神经网络时，往往存在消失/爆炸梯度下降的问题。本文精心设计了一个满足“理想”激活函数每一个属性的新激活函数，并使得神经网络在训练速度和精度方面的性能都得到大幅提升。我们将提出的激活函数命名为rectifiedhyperbolicsecant(ReSech)。
　　本文的第二个贡献是通过基于字符的文本分类来解决“理解语言”的问题。人们常常觉得这是一个自然语言的“理解”问题而不是“分类”问题，后来发现通过文本分类来解决“理解语言”这一艰巨任务是独辟蹊径且可行的。首先，在社交媒体时代，很多用户创建的内容是杂乱无章的、非结构化的，甚至有人会说是无意义的。通过分析凌乱文本的语法结构来提取数据非常具有挑战性，因为凌乱的文本并不遵循标准的语法规则。其次，语言确实会随着时间的推移而发展，人们不断地创造新的流行语和备忘录，尤其是在网络世界里。基于这些原因，以及更多的原因，通过文本分类来解决理解语言的问题是合理的。对文本进行分类编码的方法主要有两种，即文字编码和字符编码。本文主要研究基于字符的文本分类，因为字符(像图像的像素)是句子最基本的结构。此外，与基于字符的文本分类技术不同，基于字符的文本分类有一个好处，它可以学习到错误拼写、表情符号和新词的建模。而且更重要的是，相同的模型可以用于不同的语言，甚至是那些无法细分到单词的语言。
　　本文的第三个贡献是设计了一种极其轻量级的、记忆效率极高的卷积神经网络架构用于文本分类。所提出的模型是非常精简的，因为它的参数只有一百多个，重量不到1兆字节。它的效率很高，因为它不需要调整参数以适应新的任务，也就是说，同一个模型可以用于不同的文本分类任务，可以在参数设置相同的情况下，在不同的数据集上使用同一个模型。鉴于其特性，我们将提出的模型命名为CharTeC-Net，它最适合于计算能力有限的平台。这个新的架构由四个构建块组成，用于特征提取。除了最后一个之外，每个构件都使用了1×1的点向卷积层来增加网络的非线性，并增加了每个构件内的维度。此外，每个构建块中都使用了快捷连接，以方便梯度在网络中流动，更重要的是确保了训练数据中存在的原始信号在每个构建块中共享。在八个标准的大规模文本分类和情感分析数据集上的实验表明，尽管CharTeC-Net比同类产品轻很多，与最先进的方法相比，CharTeC-Net依然表现出了优于基线方法的性能和很好的准确性。

其他文献

中国高技术产业创新系统资源配置效率与优化研究

近年来，中国高技术产业保持着较为快速的发展态势，在推进经济可持续发展、加快制造业转型升级、打造产业科技创新高地的进程中，发挥着引擎作用。在创新驱动发展与供给侧结构性改革的背景下，中国高技术产业创新取得了一定进展，但自主创新能力仍有待提升，核心技术的掌握仍是一个难题，技术获取仍然需要一定技术引进，重生产轻技术开发的问题依然存在。产业创新系统是国家创新体系的重要组成部分，是区域创新系统与企业创新系统的

学位

高技术产业

突发事件成因视角下的应急设施选址机制研究——以差异化需求为背景

突发事件不被期待，却年年造访；猝不及防，毫无征兆。近年来突发事件发生的频率在全球范围内呈现递增的态势，带来的危害和损失也越来越大。为了尽可能的避免、减少人员伤亡和经济损失，需要在应急管理过程中重点关注应急设施系统的规划。应急设施的规划设计是突发事件应急响应效率的基础，其缺陷无法通过后期的应急管理进行弥补。因此，如何进行应急设施的合理布局成为降低突发事件损失的关键所在。目前，我国对应急设施选址的规划

学位

应急设施

面向电网多业务的星地融合网络接入选择研究

学位

基于移动网络数据的群体移动性预测方法研究

学位

感知模型驱动的特定场景图像质量评价方法研究

学位

船舶岸电监控与运维一体化系统研究

近年来随着对港口环保的要求不断提升，船舶岸电技术在靠港船舶中的应用越来越广泛。船舶岸电是指船舶靠港后停止使用船舶柴油机机发电，而采用港口岸电系统向船舶提供电力，从而减少大气污染物排放。船舶岸电的监控与运维一体化技术研究，对提高港口岸电系统运行的稳定性和高效性具有重要意义。　　本文针对船舶岸电监控与运维一体化系统展开了研究，设计了监控与运维系统的总体架构和系统功能，研究了岸电并网运行过程中船舶负载变

学位

船舶岸电

船体外板曲面成形智能决策支持系统研究

目前，国内的造船企业对于船体外板的加工成形，都是依赖于经验丰富的工人手工加工来完成。随着我国造船业的蓬勃发展和订单量的增加，传统的手工加工方式在造船质量与造船速度都无法满足日益增长的需求，造船技术亟需现代化升级。同时，在2016年国务院发布的《中国制造2025》发展战略中明确提出了智能制造、绿色制造的诉求，并将海洋工程装备和高技术船舶这两个领域作为未来十年的发展重点之一。因此，研究船体外板的曲面成

学位

造船企业

面向物联网时序数据分析与应用的深度学习框架研究

随着物联网技术的发展,越来越多的传感器出现在日常生活和工业领域中,海量传感器产生的时间序列数据具有动态性、异构性、大规模性以及时间依赖性等特点,增加了在不同物联网应用中的决策的艰难性。对物联网时序数据进行分析时,需要综合考虑多种类型的传感器数据来提升时序数据预测性能。同时,对物联网中传感器产生的大量数据存在的异常进行检测,也是亟需解决的问题,通过对物联网时序数据进行异常检测,可以降低异常造成的损失

学位

物联网

基于深度学习的视觉问答方法研究

随着多模态数据的积累和深度学习的飞速发展，以视觉问答为代表的跨模态学习任务得到了广泛的关注和研究。视觉问答是指给定图像和自然语言的问题，对图像的视觉元素进行推理以推断出正确的答案。该任务是一项具有挑战性的多模态学习任务，因为它需要同时理解文本和视觉模态。因此，以细粒度的方式表示问题和图像在模型性能的提升上起着至关重要的作用。为了获得细粒度的表示方式，本文以注意力机制为基础设计了端到端的深度神经网络

学位

视觉问答

基于全卷积神经网络的图像语义分割研究

图像语义分割作为计算机视觉中一个非常重要的研究领域，对图像内容的分析和理解发挥着极其重大的作用。图像语义分割能够根据图像中不同的语义含义对每个像素点进行分类，使得属于相同类型对象的像素点被划分为同组。近年来，随着全卷积神经网络的出现和发展，图像语义分割技术取得了极大的进展。然而，现有的基于全卷积神经网络的图像语义分割方法目前仍存在着难以正确分割多尺度物体、丢失大量空间信息以及缺少上下文信息等主要问

学位

图像语义分割

Research on Activation Functions and Understanding Language with Text Classification

其他学术论文