机器学习发展现状及应用的研究

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:hudongfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]本文首先介绍了近几年有关机器学习的一些热门事件,例如大为火热的AlphaGo以及2017年首次举行的中国人工智能大会(CCAI)。接下来将文章分为3个部分来阐述机器学习:第一部分详细介绍机器学习的发展历程,包括萌芽-发展-繁荣三个阶段;第二部分着重分析了机器学习的常见方法,有监督学习、无监督学习以及强化学习;最后介绍了机器学习在各行各业中的一些具体应用。
  [关键词]人工智能;机器学习;强化学习;无人驾驶
  中图分类号:S265 文献标识码:A 文章编号:1009-914X(2018)24-0227-02
  1.引言
  2016年年初,AlphaGo以4:1战胜了世界围棋冠军李世石,这一大事件瞬间引起了全球对人工智能的兴趣。一时间,人们茶余饭后都在围绕着人工智能这一领域展开。2017年07月22-23号在杭州举行了中国国内级别最高,规模最大的人工智能大会—中国人工智能大会(CCAI)。大会上汇聚了全球人工智能领域的顶级专家、学者和产业界优秀人才,围绕当前人工智能热点话题、核心技术以及广泛关注的科学问题进行深入交流和探讨,再一次将人工智能推向了热潮。
  人工智能的主要三大驱动力:大数据,机器学习以及硬件GPU。本文主要从人工智能的算法——机器学习方面来展开论述。机器学习(MachineLearning)的本质是基于互联网的海量数据以及系统强大的并行运算能力,让机器自主模拟人类学习的过程,通过不断“学习”数据来做出智能决策行为。
  2.机器学习的发展历程与相关要素
  2.1 机器学习的发展历程
  机器學习属于人工智能中一个较为年轻的分支,可以大致分为以下三个发展历程:
  第一阶段:20世纪50年代中期—60年代中期,这一时期处于萌芽时期。人们试图通过软件编程来操控计算机完成一系列的逻辑推理功能,进而使计算机具有一定程度上类似人类一样的智能思考能力。然而这时期计算机所推理的结果远远没有达到人们对机器学习的期望。通过进一步研究发现,只具有逻辑推理能力并不能使得机器智能。研究者们认为,使得机器拥有人工智能的前提还必须是拥有大量的先验知识[1]。
  第二阶段:20世纪60年代中期—80年代中期,这一时期处于发展时期。人们试图利用自身思维提取出来的规则来教会计算机执行决策行为,主流之力便是各式各样的“专家系统”,然而这些系统总会面临“知识稀疏”的问题,即面对无穷无尽的知识与信息,人们无法总结出万无一失的规律。因此,让机器自主学习的设想自然地浮出水面。基于20世纪50年代对于神经网络的研究,人们开始研究如何让机器自主学习。
  第三阶段:20世纪80年代—至今,机器学习达到了一个繁荣时期。由于这一时期互联网大数据以及硬件GPU的出现,使得机器学习脱离了瓶颈期。机器学习开始爆炸式发展,开始成为了一门独立热门学科并且被应用到各个领域。各种机器学习算法不断涌现,而利用深层次神经网络的深度学习也得到进一步发展。同时,机器学习的蓬勃发展还促进了其他分支的出现,例如模式识别,数据挖掘,生物信息学和自动驾驶等等。
  2.2 机器学习的常见方法
  机器学习发展至今,常用的主要有以下三大类:监督学习,无监督学习和强化学习(图1)。
  2.2.1 监督学习
  监督学习表示机器学习的数据是带标记的,这些标记可以包括数据类别,数据属性以及特征点位置等等。这些标记作为预期效果,不断来修正机器的预测结果。具体首先过程是:通过大量带有标记的数据来训练机器,机器将预测结果与期望结果进行比对;之后根据比对结果来修改模型中的参数,再一次输出预测结果;再将预测结果与期望结果进行比对……重复多次直至收敛,最终生成具有一定鲁棒性的模型来达到智能决策的能力。
  常见的监督学习有分类,回归。分类(classification)是将一些实例数据分到合适的类别中,它的预测结果是离散的。回归(regression)是将数据归到一条“线”上,即为离散数据生产拟合曲线,因此其预测结果是连续的。
  2.2.2 无监督学习
  无监督学习表示机器学习的数据是没有标记的。机器从无标记的数据中探索并推断出潜在的联系。常见的无监督学习有聚类,降维。
  在聚类(clustering)工作中,由于事先不知道数据类别,因此只能通过分析数据样本在特征空间中的分布,例如基于密度或是基于统计学概率模型等等,从而将不同数据分开,把相似数据聚为一类。
  降维(dimensionality reduction)是将数据的维度降低。例如描述一个西瓜,若只考虑外皮色泽,根蒂,敲声,纹理,密度以及含糖率这6个属性,这6个属性代表了西瓜数据的维度为6。进一步考虑降维的工作,由于数据本身具有庞大的数量和各种属性特征,若对全部数据信息进行分析,将会增加训练的负担和存储空间。因此可以通过主成分分析等其他方法,考虑主要影响因素,舍弃次要因素,来平衡准确度与效率。
  2.2.3 强化学习
  强化学习是带激励的,具体来说就是,如果机器行动正确,将施与一定的“正激励”;如果行动错误,也同样会给出一个惩罚(也可称为“负激励”)。因此在这种情况下,机器将会考虑如何在一个环境中行动才能达到激励的最大化,具有一定的动态规划思想[2]。例如在贪吃蛇游戏中,贪吃蛇需要不断吃到“食物”来加分。为了不断提高分数,贪吃蛇需要考虑在自身位置上如何转向才能吃到“食物”,这种学习过程便可理解为是一种强化学习。
  强化学习最为火热的一个应用便是谷歌AlphaGo的升级品—AlphaGo Zero。相较于AlphaGo,AlphaGo Zero舍弃了先验知识。不再需要人为设计特征,直接将棋盘上黑白棋子的摆放情况作为原始数据输入到模型中,机器使用强化学习来自我博弈,不断提升自己最终出色完成下棋。AlphaGo Zero的成功证明了在没有人类的经验和指导下,深度强化学习依然能够出色完成指定任务。   3.机器学习的应用
  由于近20年科技的迅速发展,机器学习已经成为了一门活跃并且充满生命力的学科。机器学习具备了一定的解决实际生活问题的能力,通过把机器学习当作是一种基础与服务技术,和不同领域进行结合碰撞出火花[3]。而在各行各业里都少不了机器学习的应用。
  (1)医疗行业
  机器学习算法被应用到提供医疗辅助、癌症检测和新药物研制等。广泛推进医疗智能化,对全球医疗事业的发展有着非常重要的意义[4]。其中最为著名的也是当属IBM的智能机器人沃森。IBM技术团队首先将庞大的数据信息输入到沃森中,这个庞大的数据库包括了医疗论文与报道,临床指南,药物使用报告以及上千上万本患者病历等。之后利用AI算法进行分析處理,从而为医生提供医疗辅助,更高效精准地进行医疗诊断。
  (2)传媒行业
  通过内容传播机器人以及品牌传播机器人,一键生成用户想要的内容,一分钟内可出一万篇文章,并且进行有效的传播。基于机器学习搭建的智能媒体平台,可以通过研究媒体的投递和发送规则,结合当前热点事件、舆论和公关营销内容,自动生成用户想要阅读的内容。并且可以智能地对接主流媒体平台,自动同步发送,实现了高效传播。
  (3)汽车行业
  汽车行业,以自动驾驶为例,谷歌(如图2)、百度、特斯拉等传统巨头纷纷加入其中。自动驾驶是汽车行业与人工智能、物联网等新一代信息技术深度融合的产物,是当前全球交通出行智能化和网联化的重要方向。自动驾驶利用传感器和激光雷达等感知器采集路况和行人信息,结合先进机器学习算法,不断优化并最终规划出最优路线以及操控方案。
  4.总结
  机器学习作为最近三十年新兴起的科研学科之一,已经在现代信息生活各个领域上都有了较为广泛的应用。并且发展至今,机器学习已经衍生出了众多分支,如数据挖掘、深度学习、模式识别、机器人的智能控制、遥感信息安全等。因此,机器学习与各行各业的结合,必将引起一番改革大浪潮。
  参考文献
  [1] 吴康宁.基于人工智能下的机器学习历史及展望研究[J].科技尚品.2017(6):187.
  [2] 高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报.2004,30(1):86-100.
  [3] 陈春霞.浅析机器学习的发展与应用[J].信息系统工程.2017(8):99-100.
  [4] 孔祥溢与王任直,人工智能及在医疗领域的应用.医学信息学杂志,2016.37(11):第1-5页.
  [5] 刘忠宝.机器学习方法在个性化推荐系统中的应用[J].情报探索.2016(4):80-82.
其他文献
[摘 要]园林是人们生活、工作、学习的环境,而园林的各种形式则是源于生活,源于人们的感受、体验。本文从园林的定义入手,讲述园林创作应回归生活,同时从诗画园林、乡野园林、大众园林三个方面来讲述园林与生活的关系。以期能够呼吁人们多关注生活,多动手参与园林的建设。  [关键词]园林;生活  中图分类号:S271 文献标识码:A 文章编号:1009-914X(2018)24-0236-01  园林是人们生
期刊
[摘 要]互联网时代已经改变了世界,体验经济也慢慢出现。用户强调产品的服务质量的同时,更希望通过切实体验来获得满足。用户在体验过程中,将会通过对产品体验的初印象(总体和主观体验),来直接反映、影响用户的态度。同样,我们设计的“产品”,在用户等待的过程中也将直接影响他们对产品服务质量的判断,影响用户体验。现如今,不论是手机端还是PC端,高速率发展的应用程序层出不穷,令大家眼花缭乱。那么应用程序中千篇
期刊
[摘 要]电视已经成了千家万户不可或缺的一部分,同时电视逐渐向皮通话发放,电视新闻也逐渐成为人们了解社会政治、经济、文化等发展的重要方式,它可以更加立体、准时的呈现在大众面前,在整个传播领域中占据着重要位置。新闻是由新闻记者、摄影师和制作人通过奔波、采访等方式得来的原材料,再由新闻编辑对其再加工形成的,一个优秀的新闻编辑应该具有独特的审美能力和较强的专业素质,在以良好的敬业精神作为保障,本文主要介
期刊
[摘 要]在一定的时期将生长拥挤的较小苗木从苗床上挖起来,更换育苗地并按规定的株行距栽种下去,让小苗更好地生长发育,这种育苗的操作方法叫移植,也叫移栽。几经过移植的苗统称为移植苗。  [关键词]园林树木;移植;管理  中图分类号:S58.1 文献标识码:A 文章编号:1009-914X(2018)24-0238-01  苗木在幼年时较喜阴或耐阴,一般需要密植,而且幼苗生长所需要的营养面积小,密植可
期刊
[摘 要]随着我国社会经济的不断发展,我国的科学技术得到飞速的发展,尤其是增强现实作为提高人们体验的技术,在刑事科学技术中的应用越来越受到人们的关注,成为了刑事科学技术新的发展思路,对于增强刑事科学技术的服务能力具有非常重要的作用。笔者分析增强现实技术的概念,并且分别就其在刑事科学技术中的应用提出相关措施,希望对促进增强现实在刑事科学技术中的应用做出积极贡献。  [关键词]增强现实技术;人工智能;
期刊
[摘 要]铁路系统为不同城市间的贸易往来和人们的出行提供了极为便利的条件,不仅速度快,承载能力强,而且价格低,安全稳定,近些年,在我国取得了迅速的发展。铁路信号系统是铁路系统中的重要构成部分,为整个系统安全、稳定、高效的运行提供了基本保证。但由于信号系统的复杂程度高,容易受到多种不同因素的影响而被破坏,比如:雷击、暴雨等等。因此,铁路工作人员要充分做好信号系统的防护处理,避免其受到雷击的影响。本文
期刊
[摘 要]近年来,食品安全已经成为社会热点话题。工业生产中产生的废气、废水、废渣不经处理直接排放,造成土壤和地下水的严重污染。其中的镉、砷、铜、锰等重金属在动植物体内逐渐积累,食用一定量后将会导致人体重金属慢性中毒。因此,必须要采用一种高效、准确、方便的食品重金属含量测定方法,保证食品质量安全。本文以重金属砷为例,对氢化物发生原子荧光光谱法具体的测定方法以及测定中需要注意的事项进行了分析。  [关
期刊
[摘 要]茶叶的内涵不仅仅只是作为饮品呈现在人们的面前,它同样也是人文、心性的集合体。本文主要从山区茶叶栽培技术、山区茶叶的管理技术方法作简单的阐述。  [关键词]山区茶叶 种植 管理  中图分類号:S311 文献标识码:A 文章编号:1009-914X(2018)24-0239-01  在不断发展的社会环境中,茶逐渐成为了我国最具代表性的饮品。目前我国现有茶叶种植由于经营分散、缺乏栽培技术、管理
期刊
[摘 要]随着我国经济迅速发展,各个行业对电力有着越来越多的依赖,而变压器作为电力行业网络中至关重要的一部分,其安装质量直接影响着变电站运行的可靠性。为此,变压器的安装应受到相关技术人员的重视。由于过程复杂,技术人员在作业时必须保持严谨的工作态度,针对常见缺陷采取有效处理措施,保证变压器正常运行。本文对变压器的安装及可能存在缺陷的处理进行了简要分析。  [关键词]变压器;安装;缺陷  中图分类号:
期刊
[摘 要]物探测量往往是在进行石油勘探时的第一个步骤,因为勘探工作是开采工作的先导,所以勘探工作的是否完善决定着后续工作才能够顺利进行。在当下,石油已成为世界范围内的主要能源,也是我国的一项重要的战略资源,油气的消耗量还在呈现逐年上升的趋势,所以石油物探测量工作要必须重视起来。目前GPS-RTK技术作为比较新颖的一门技术,如果在工作中能够得到广泛应用,就可以提高测量精度和测量效率,同时对物力人力的
期刊