论文部分内容阅读
在好莱坞科幻大片肆无忌惮轰炸我们感官的时代,我们似乎对很多“无人”的东西都能欣然接受,不过从“有人”到“无人”的过程远不像我们在电影中看到的那么简单
从古至今,人类始终对模仿这个事儿乐此不疲,全国各大小电视台的模仿秀节目依然此起彼伏,这也从一个侧面证明了人们对所谓“模仿”的兴趣。除了模仿其他人或动物或东西,人们还有一个兴趣就是模仿自己,电影大师卓别林和天王迈克尔·杰克逊都干过这样的事儿,但好像都没有得到模仿冠军,由此可见,模仿的过程中一些元素被升华了。
我们再说另一件有些关系的事儿。上世纪中叶出现了一种边缘科学叫仿生学,而表达它的英文单词就是由“生命意义”和“工程技术”两层意思所组成。说个离主题比较近的例子,目前高速飞行器上实现自动驾驶的核心部件振动陀螺仪就是根据苍蝇利用自己楫翅导航的原理制造的,当然,这只是仿生的单项应用而已。
目前国内影响力最大的无人驾驶技术项目是由国家自然科学基金委员会重大研究计划所引起的,而所谓的“无人驾驶”,只是这个计划为印证其目标达到与否的方式而已。
为了让大家更全面地了解这项正在突飞猛进发展的技术,我们简要介绍一下国家自然科学基金委所制定的科学目标,当然这只是此计划的一个目标描述,不代表它不会应用在其他领域,例如军事。
与人类视听觉感知密切相关的图像、语音和文字信息在现代社会各个领域占据着绝对重要的位置,也正是因为这类信息可以被人类直接感知理解,所以我们对这些信息的要求也就越来越高,特别是对它们的综合处理能力。现阶段计算机对此类信息的处理能力还远不及人类本身,而我们的社会发展则需要计算机的处理能力越来越接近我们,如何借鉴人类的认知机理并综合其他相关成果来让计算机的能力接近人类就成了我们当前的目标。
目标的关键在于从人类的感知机理出发,构建新的计算模型和方法,使非结构化的感知信息和异构信息不再是计算机处理难题。具体围绕“感知特征提取、表达与整合”、“感知数据的机器学习与理解”和“多种模式状态信息协同计算”三项课题来研究,后综合研究成果研制具有自然环境感知与智能行为决策能力的无人驾驶车辆验证平台,主要性能指标争取达到世界先进水平,以此提升我国在视听觉信息处理领域的整体实力。
大家现在明白了吧,这个计划的目标可以说是人工智能的第一阶段,把类人信息处理作为首要任务,具体表现方式就是“无人驾驶”,而研究执行者更愿意称之为“智能车”。
早在2009年6月,国家自然科学基金委员会就主办了第一届中国“智能车未来挑战”比赛,旨在检验阶段性成果。2010年为第二届,水平较一年前又有了很大提高,此事也引起了我们极大的兴趣。我们专程来到负责组织比赛的西安交大(同时也是参赛队之一),以及另外两家参赛院校清华大学和军事交通学院进行专访,在与教授和同学的交流中对“智能车”也有了些许了解。
什么是智能车
简单地说,智能车就是让车子有“思考能力”,就是在轮子的基础上加上“大脑”,能够像人那样看路、选路、躲避障碍。我们甚至还可以用几个关键词来概括:视觉——看路;规划——选路;行驶——控制车辆,即按照已有规划行驶并在行进中处理各种突发情况。这其中不但有智能决策的问题,更重要的是如何将这些决策付诸实施的问题,我们不妨简单了解一下各个步骤中的难点。
视觉信息
这里的视觉是一种直观的说法,因为车子要先能够“看”到路面信息,才能有智能的判断,实现自动驾驶。但这种叫法也略有些偏颇,因为收集信息的过程中并不局限于对动态摄像机和雷达的应用,比如还可以通过与路面上其他智能车辆的通讯来交流彼此的位置或意图。
准确和快速地采集信息,是智能车要做的第一步。现阶段,主要的信息来源仍停留在视觉上——雷达和摄像头。通过它们可以获取大量的路面信息,包括道路的边界、道路上的标线、车辆周围的人车及运动状况、道路两侧的指示牌和信号灯等等。
即使仅考虑视觉信息的采集,这个基础问题仍面临着不小的挑战。在计算机范畴一有个著名的困难就是“模糊”智能。打个比方,我们人类可以从很远的地方就依靠眼睛采集来的信息辨认出一个熟人,即使看到的不是脸部特征或者穿的不是我们熟悉的衣服也不会造成太大困扰,但计算机却很难实现这种“模糊”判断。在智能车技术领域,可以通过摄像机和雷达来判断道路的状况,道路两旁的标识,道路上物体的移动情况,但它如何判断路上移动的物体是行人还是行人的影子?如何区分一个小孩子和一条小狗?如何区别一个大石头和一个大坑?如果路的两边停满车,它如何通过路的边界来判断道路的曲折程度?这些仍旧是摆在技术人员面前不小的问题。
来自视觉的信息量是非常巨大的,一方面要把来自雷达和摄像机的信息有机综合存储,另一方面要通过高速的运算及时提取出需要的信息,这样一来对存储、提取和运算信息提出了很高要求,硬件软件都有。
道路规划
为了行车的顺畅,计算机一般会先规划出一条或几条路线,以尽量减小行驶过程中的计算量,道路规划也是一个有难度的课题。规划更多需要一种大局观和综合考虑能力,这目前在计算机领域也很难达到一个较理想的水平。像现在的GPS导航仪,它为什么总是规划不出我们人脑希望的路线?这其实也是一种模糊处理,尤其是对人们最终需求的模糊理解。说白了,计算机和人类之间还很难达到如和与乾隆皇帝那般默契——不仅知道你想什么而且还有升华。
还有一点,现阶段计算机还很难做到自我学习。一般来说,人们会先给出一些规则,计算机会根据给定规则去分析现有状况,从而规划出行车路线。但计算机难以做到自我学习和更正,这次规划的线路不合适,下次它也不会做出任何改善,除非人们主动去改善规则。这种能够自动利用不断积累的经验,自我学习自我完善的能力也是计算机领域研究的难点之一。如果计算机能做到自我完善,应该首先拥有自我意识,就像很多科幻电影的内容一样;换句话:如果我都不知道“我”是我,我干嘛要自我完善。
车辆控制
世界范围内的汽车已经进入电子控制时代了,各种电子控制程序也琳琅满目地出现在汽车产品上。我们可以想到,实现车辆智能控制的形式也应该是通过电子信号完成的,这样车辆自身的执行机构就会对电信号做出及时准确的响应。看起来顺理成章,不过国内的智能车却很难做到这一点。
由于国内汽车制造基础薄弱,没有汽车总线控制技术的充分积累,很多研究机构都拿不到号称“商业机密”的车辆总线技术资料,根本不可能从车辆原有电子控制基础入手来控制车辆,只能从外部采用原始的机械力学方式。方向盘、刹车、油门、挡位的控制都要通过外加步进电机来实现,增加额外外部设施和能源消耗不说,这种原始的控制方式对可靠性和舒适性的保障都是非常有限的。我们人类在驾驶不同车型的时候都需要适应和调整控制方法,这类外部的控制电机很粗糙,机械控制就很难谈得上精确了,大家想象一下就知道其控制过程是什么样的了。
智能车对我们的意义
人类技术的发展方向就要找到更“智能”的方式去解决问题,从而把人类自己一步步地解放出来。智能车,不但可以把不喜欢驾驶的人从这种体力劳动中解放出来,还有更进一步的意义:它更稳定、更可靠,可以进一步扩大交通容量,可以避免人类驾驶中大多数交通事故。
我们所处的位置决定了我们的视野,人类还不太可能去了解比自己高级的智能形式,至少目前是这样。而计算机作为人类的工具,模拟人类的思维方式和机制即成为人工智能的主要目标。我们尚且对人脑如何思维了解得不够全面透彻,更何况要用只知道0和1的计算机来模拟人脑,所以我们必须承认,在这个领域的研究,我们还处在相当初级的阶段。
这辆伸出数个摄像头和外挂装置的车,是天津军事交通学院所改造的无人驾驶版猛士。车内的计算机和自动驾驶伺服设备共同支配着这辆车,目前它可以自动识别不规则路段并自行驾驶,且车速还不低。项目组成员介绍,越野道路状况下的道路识别是更难的技术。让我们期待自动驾驶技术的进一步完善吧,到那时候,一个人坐在车里睡大觉也能按时到达目的地了!
从古至今,人类始终对模仿这个事儿乐此不疲,全国各大小电视台的模仿秀节目依然此起彼伏,这也从一个侧面证明了人们对所谓“模仿”的兴趣。除了模仿其他人或动物或东西,人们还有一个兴趣就是模仿自己,电影大师卓别林和天王迈克尔·杰克逊都干过这样的事儿,但好像都没有得到模仿冠军,由此可见,模仿的过程中一些元素被升华了。
我们再说另一件有些关系的事儿。上世纪中叶出现了一种边缘科学叫仿生学,而表达它的英文单词就是由“生命意义”和“工程技术”两层意思所组成。说个离主题比较近的例子,目前高速飞行器上实现自动驾驶的核心部件振动陀螺仪就是根据苍蝇利用自己楫翅导航的原理制造的,当然,这只是仿生的单项应用而已。
目前国内影响力最大的无人驾驶技术项目是由国家自然科学基金委员会重大研究计划所引起的,而所谓的“无人驾驶”,只是这个计划为印证其目标达到与否的方式而已。
为了让大家更全面地了解这项正在突飞猛进发展的技术,我们简要介绍一下国家自然科学基金委所制定的科学目标,当然这只是此计划的一个目标描述,不代表它不会应用在其他领域,例如军事。
与人类视听觉感知密切相关的图像、语音和文字信息在现代社会各个领域占据着绝对重要的位置,也正是因为这类信息可以被人类直接感知理解,所以我们对这些信息的要求也就越来越高,特别是对它们的综合处理能力。现阶段计算机对此类信息的处理能力还远不及人类本身,而我们的社会发展则需要计算机的处理能力越来越接近我们,如何借鉴人类的认知机理并综合其他相关成果来让计算机的能力接近人类就成了我们当前的目标。
目标的关键在于从人类的感知机理出发,构建新的计算模型和方法,使非结构化的感知信息和异构信息不再是计算机处理难题。具体围绕“感知特征提取、表达与整合”、“感知数据的机器学习与理解”和“多种模式状态信息协同计算”三项课题来研究,后综合研究成果研制具有自然环境感知与智能行为决策能力的无人驾驶车辆验证平台,主要性能指标争取达到世界先进水平,以此提升我国在视听觉信息处理领域的整体实力。
大家现在明白了吧,这个计划的目标可以说是人工智能的第一阶段,把类人信息处理作为首要任务,具体表现方式就是“无人驾驶”,而研究执行者更愿意称之为“智能车”。
早在2009年6月,国家自然科学基金委员会就主办了第一届中国“智能车未来挑战”比赛,旨在检验阶段性成果。2010年为第二届,水平较一年前又有了很大提高,此事也引起了我们极大的兴趣。我们专程来到负责组织比赛的西安交大(同时也是参赛队之一),以及另外两家参赛院校清华大学和军事交通学院进行专访,在与教授和同学的交流中对“智能车”也有了些许了解。
什么是智能车
简单地说,智能车就是让车子有“思考能力”,就是在轮子的基础上加上“大脑”,能够像人那样看路、选路、躲避障碍。我们甚至还可以用几个关键词来概括:视觉——看路;规划——选路;行驶——控制车辆,即按照已有规划行驶并在行进中处理各种突发情况。这其中不但有智能决策的问题,更重要的是如何将这些决策付诸实施的问题,我们不妨简单了解一下各个步骤中的难点。
视觉信息
这里的视觉是一种直观的说法,因为车子要先能够“看”到路面信息,才能有智能的判断,实现自动驾驶。但这种叫法也略有些偏颇,因为收集信息的过程中并不局限于对动态摄像机和雷达的应用,比如还可以通过与路面上其他智能车辆的通讯来交流彼此的位置或意图。
准确和快速地采集信息,是智能车要做的第一步。现阶段,主要的信息来源仍停留在视觉上——雷达和摄像头。通过它们可以获取大量的路面信息,包括道路的边界、道路上的标线、车辆周围的人车及运动状况、道路两侧的指示牌和信号灯等等。
即使仅考虑视觉信息的采集,这个基础问题仍面临着不小的挑战。在计算机范畴一有个著名的困难就是“模糊”智能。打个比方,我们人类可以从很远的地方就依靠眼睛采集来的信息辨认出一个熟人,即使看到的不是脸部特征或者穿的不是我们熟悉的衣服也不会造成太大困扰,但计算机却很难实现这种“模糊”判断。在智能车技术领域,可以通过摄像机和雷达来判断道路的状况,道路两旁的标识,道路上物体的移动情况,但它如何判断路上移动的物体是行人还是行人的影子?如何区分一个小孩子和一条小狗?如何区别一个大石头和一个大坑?如果路的两边停满车,它如何通过路的边界来判断道路的曲折程度?这些仍旧是摆在技术人员面前不小的问题。
来自视觉的信息量是非常巨大的,一方面要把来自雷达和摄像机的信息有机综合存储,另一方面要通过高速的运算及时提取出需要的信息,这样一来对存储、提取和运算信息提出了很高要求,硬件软件都有。
道路规划
为了行车的顺畅,计算机一般会先规划出一条或几条路线,以尽量减小行驶过程中的计算量,道路规划也是一个有难度的课题。规划更多需要一种大局观和综合考虑能力,这目前在计算机领域也很难达到一个较理想的水平。像现在的GPS导航仪,它为什么总是规划不出我们人脑希望的路线?这其实也是一种模糊处理,尤其是对人们最终需求的模糊理解。说白了,计算机和人类之间还很难达到如和与乾隆皇帝那般默契——不仅知道你想什么而且还有升华。
还有一点,现阶段计算机还很难做到自我学习。一般来说,人们会先给出一些规则,计算机会根据给定规则去分析现有状况,从而规划出行车路线。但计算机难以做到自我学习和更正,这次规划的线路不合适,下次它也不会做出任何改善,除非人们主动去改善规则。这种能够自动利用不断积累的经验,自我学习自我完善的能力也是计算机领域研究的难点之一。如果计算机能做到自我完善,应该首先拥有自我意识,就像很多科幻电影的内容一样;换句话:如果我都不知道“我”是我,我干嘛要自我完善。
车辆控制
世界范围内的汽车已经进入电子控制时代了,各种电子控制程序也琳琅满目地出现在汽车产品上。我们可以想到,实现车辆智能控制的形式也应该是通过电子信号完成的,这样车辆自身的执行机构就会对电信号做出及时准确的响应。看起来顺理成章,不过国内的智能车却很难做到这一点。
由于国内汽车制造基础薄弱,没有汽车总线控制技术的充分积累,很多研究机构都拿不到号称“商业机密”的车辆总线技术资料,根本不可能从车辆原有电子控制基础入手来控制车辆,只能从外部采用原始的机械力学方式。方向盘、刹车、油门、挡位的控制都要通过外加步进电机来实现,增加额外外部设施和能源消耗不说,这种原始的控制方式对可靠性和舒适性的保障都是非常有限的。我们人类在驾驶不同车型的时候都需要适应和调整控制方法,这类外部的控制电机很粗糙,机械控制就很难谈得上精确了,大家想象一下就知道其控制过程是什么样的了。
智能车对我们的意义
人类技术的发展方向就要找到更“智能”的方式去解决问题,从而把人类自己一步步地解放出来。智能车,不但可以把不喜欢驾驶的人从这种体力劳动中解放出来,还有更进一步的意义:它更稳定、更可靠,可以进一步扩大交通容量,可以避免人类驾驶中大多数交通事故。
我们所处的位置决定了我们的视野,人类还不太可能去了解比自己高级的智能形式,至少目前是这样。而计算机作为人类的工具,模拟人类的思维方式和机制即成为人工智能的主要目标。我们尚且对人脑如何思维了解得不够全面透彻,更何况要用只知道0和1的计算机来模拟人脑,所以我们必须承认,在这个领域的研究,我们还处在相当初级的阶段。
这辆伸出数个摄像头和外挂装置的车,是天津军事交通学院所改造的无人驾驶版猛士。车内的计算机和自动驾驶伺服设备共同支配着这辆车,目前它可以自动识别不规则路段并自行驾驶,且车速还不低。项目组成员介绍,越野道路状况下的道路识别是更难的技术。让我们期待自动驾驶技术的进一步完善吧,到那时候,一个人坐在车里睡大觉也能按时到达目的地了!