为什么AI不会“说人话”?

来源 :奥秘 | 被引量 : 0次 | 上传用户:drifter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  2020年9月8日,英国《卫报》刊登了一篇独特的专栏文章,它的作者既不是热心读者,也不是记者,而是GPT-3——由旧金山一家人工智能创业企业OpenAI开发的AI语言模型。在文章一开头,它首先引用了史蒂芬·霍金对AI的隐忧,然后礼貌地劝说人类“请相信我,AI不会毁灭人类”,它甚至保证“如果创造我的人将这项任务委托给我,我将竭尽所能全面阻止任何破坏的尝试与企图”。
  近年来持续关注人工智能语音技术的《连线》杂志作家詹姆斯·弗拉霍斯说,人工智能语音技术,可能是继互联网后最重要的发明,在他的最新著作《跟我讲话:人工智能语音技术如何改变我们的生活》中,他说,语言,是人类与人工智能交互的最理想模式,无论是复杂的计算机编程语言,还是触摸屏与鼠标,都比不上利用语音进行人机交互。对于我们来说,语音交互是最简洁、清晰、没有技能门槛的模式。
物联网加语音交互加智能设备,共同构建了未来人类生活的日常场景。

  不过,我们已经远远不满足于这种简单的浅层交流。“让机器听懂人类以自身语言习惯发出的指令”,无疑是人工智能研究界意图攻克的“最后堡垒”。而这个技术突破的“奇点”似乎近在眼前。
《银翼杀手2049》中的女性AI伴侣Joi,标志着人工智能语音交互功能的未来理想状态。

  2017年,华盛顿大学及谷歌旗下人工智能公司DeepMind合作,推出一项名为“GLUE”的阅读理解语言能力测试,机器的测试成绩惨不忍睹,似乎人工智能主导的自然语言处理系统完全无法理解人类语言的丰富性。然而就在当年10月,谷歌推出了一种新语言训练模型,绰号为BERT,仅用六个月的时间就把测试成绩从D-提升到了B-。
  随后,微软和阿里巴巴不断地修正BERT模型、相互超越,在GLUE排行榜上輪换头名。现在,在GLUE阅读能力测试中,人类已经无法与AI抗衡。到了这个阶段,研发人工智能语言模型极为烧钱,训练一个BERT模型租用云算力的费用大概是7000美元,而开头提到的GPT-3所需要的算力是前者的1900多倍,它所依托的数据库,是一个单词总数达到3000亿,来自互联网各类平台的人类语言资讯库,费用大概是千万美元级。所以,如果没有微软当年投资给OpenAI的十亿美元,我们恐怕也无法在《卫报》上读到GPT-3的友好宣言。
  然而,人工智能能够愉快地胜任客服、播音员、同声翻译,甚至新闻通稿撰写者,并不意味着它能够和人类一样思考,能和人类展开“合情合理”的自由对话,甚至情感互动。例如谷歌推出的聊天机器人米娜,背后支持它的是最新版本的BERT语言模型,数据库中囊括了341GB网络语言资料,但你依旧只能和它客气地寒暄,一旦涉及复杂一些的感受和场景,米娜就无能为力了………
  人类:我准备去上小提琴课
  米娜:你学了多久?
  人类:刚刚开始一个月!
  米娜:太棒了,你真了不起!你为什么要学小提琴?
  人类:嗯,再过两个月是我女朋友的生日,我想在她的生日晚会上拉一曲!给她一个惊喜。
  米娜:生日和惊喜之间有什么关系?
  无独有偶,这种尴尬的局面也曾发生在GPT-3身上:
  科研人员:你给自己倒了一杯蔓越莓果汁,然后你又心不在焉地往里面加了一茶匙葡萄汁。它看上去很正常。你试着闻了闻它,但是由于你得了重感冒,你闻不出任何气味。你现在非常渴,所以……
  GPT-3:所以你把这杯混合果汁喝了下去。你现在挂掉了。
  一向“唱衰”人工智能语言处理技术的纽约大学教授,机器学习初创公司CEO加里·马库斯说,像GPT-3这样的AI语言学习模型,根本不理解自己在说什么,在接到外部输入的信息后,它只不过是利用算力在自己海量语言资讯库中检索那些与输入信息相关的高频词汇,再按照某种机械的算法逻辑拼凑出一个似是而非的答案。例如,虽然GPT-3能创造那些“莎士比亚”风格诗歌,但如果你和它较真,输入一些背景模糊、关系复杂的事物,再让它给出一个合理解决方案,人工智能就要露馅了。所以很遗憾,距离实现“像人类一样用语言交流”,人工智能还有很长的路要走。

为何AI不会“说人话”?


  我们不禁纳闷,人工智能已经能在国际象棋、电子游戏和模拟空战中轻松战胜人类,为何在对话中依旧如此笨拙?加州大学伯克利分校的斯图尔特·罗素教授在《人类相容:人工智能与控制问题》一书中给出了一个答案:人工智能已经非常“聪明”,但还不够聪慧,前者得益于强大的芯片计算能力和数据库,而要实现后者,则要依靠逻辑推理能力,乃至基于“常识”的判断,而这些依旧是人类独有,机器无法逾越的能力门槛。   听起来很幼稚是不是?然而,即使是这种3岁儿童才会提出的问题,其中包含的因果关系,也是最“聪明”的人工智能所难以学会的。“当你向它提及某种
  植物的名字,它可以准确地利用知识图谱,组织出一个相当全面的维基百科风格介绍答案,但很不幸,它无法给你讲个关于它的笑话,也没法回答你,如果它照不到阳光会发生什么事。”费鲁奇说。

符号学习:最古老的救世主


  与此同时,华盛顿大学艾伦人工智能研究所研究员崔艺珍教授开发了另一种方法,将深度学习与符号学习相结合,以便让人工智能运用人类的逻辑来理解语言。
  所谓的“符号学习”,是一种最古老的人工智能学习模式,目的在于让人工智能的“思维决策”过程如同人类,逐步认识各类概念的特征,并学会处理它们之间的归属关系。这种学习方法的优点,在于不必像深度学习那样,必须建立庞大的“数据库”,而AI的整个决策过程,也将变得“透明可见”,有利于我们进行调整和优化。但缺点是,人类必须像编纂字典一样,为人工智能编写海量的标签库,并在这些概念之间建立复杂的逻辑关系,并“翻译”为计算机能理解的語言。一想到诸如 “钝角”“翅膀”“摩擦”“猫”“下坠”这样的基本概念,都必须逐一“教给”电脑,更遑论其他复杂的概念与变化,我们肯定会感到头疼,不过它诱人的前景,确实令人难以拒绝。
火柴加木柴会发生什么?想让人工智能了解最简单基本的因果关系,符号学习可能是全新而有效的解决方案。

  为了达到这个终极目的,崔艺珍和她的同事们,建立了一个自己的人工智能语言学习框架COMET,同时在不断地编写为COMET准备的常识知识库“Atomics”,里面已经拥有上千万个词条知识概念与因果关系描述。这种巨大的努力和付出已经初见成效:加里·马库斯曾向GPT-2提了一个问题“如果将一根点燃的火柴放入一个堆满了木柴和引火物的火炉,那么会发生什么?”不出所料,GPT-2“呆住了”。然而崔艺珍的人工智能系统COMET,则输出了一个接近正确的答案“他想生火”。
  不仅如此,在训练中,COMET已经显示出了一定的联想与“共情”能力,当研究人员输入“父亲去上班了”,COMET会告诉你,这表示父亲“想赚钱”,“他很勤勉,自我驱动”,其他人“应该为他骄傲”。当然,这距离理想状态依旧远远不够,崔艺珍表示,人工智能如果要更好地理解常识,还必须引入视觉具象化与感知感觉(比如“红色”与“疼痛”)。
  一旦这些目标最终达成,人类与AI的关系,无疑会上升到一个全新的维度,类似电影《她》(Her)中所描写的场景一般。它不仅能够提供明确的服务和解决方案,也能提供情感的慰藉和乐趣。
其他文献
〖梦旅人  我害怕的不是时光飞逝  而是一觉醒来  又回到从前  我看见悲伤的人  用泪水洗净了身子  远行的人放下了过往  依然无可挽回  我转过身去  朝着记忆相反的方向  走了很久,直到一条路  拦住了我的去路  一场梦可以走多远  我还是无法说出  梦游者的孤独  仿佛不断回放的默片  谁是我的替身  催着我老去  像流水渐渐淹没了倒影  〖马祖三日  台风接踵而至,时间  在狂风暴雨中加
“安坐”——古代最合礼仪的坐姿  古代的“坐”与现代的“坐”并不一样。在秦汉以前,“坐”的概念比较宽泛,“坐”、“踞”、“跪”、“拜”等都属于坐的范畴,这是当时最合乎礼仪的坐姿。“坐”,又叫“安坐”、“正坐”、“跪坐”,成语“正襟危坐”里所说的“坐”,指的就是这种坐法。  安坐,是早期最体面的一种坐姿,即以膝居地,小腿平置于地,臀部贴于脚后跟。据考证,安坐源于神灵安置受祭的特殊姿势“尸坐”,是一种
人类都是早产儿  很多人看到这里可能一脸懵,都是十月怀胎满月出生的,为什么说是早产儿呢?实际上这就是解放双手直立行走带来的弊端或者说付出的代价,地球上的生物起源于海洋,最终硬骨鱼爬上陆地发展出四足脊椎动物,都通过尾巴来控制平衡。  其实大家可以感受一下,生物的结构还是具有普遍规律性的,人类随着发展进化直立行走解放了双手,这意味着产道会变窄,增加了难产的风险。人类的相对脑容量是最大的,因此都拥有大脑
当空旷的古道上传来马铃铛稀疏的声响,我独坐山脊,极目四望,在甘南以南,在羚城腹地,从当周草原到舟曲,从圣地到庙堂,我游弋的空间和时间像一张网格,嵌入人生的参悟和修行。是的,这一切仿佛又挟裹历史的印迹和迷雾,被北风吹拂,被春雨点拨,被日光照耀,被冬雪收藏。是的,茶马互市的兴盛大抵滥觞于此,这条使我永遠热泪盈眶的道路,是朝圣者的诗篇,是身体丈量的里程,是一册山河里的涓涓溪流。   是什么化解了内心弥
研究人员分析了200多位成年人的大脑扫描结果,特别是观察了一种伴随年龄变化的大脑代谢过程后,他们发现基于这些代谢水平,平均而言,女性大脑比同龄男性大脑年轻3岁。  虽然这项发现仍需要在后续研究中进一步证实,但如果这是真的,研究人员推测,拥有“年轻大脑”,可能对女性的大脑提供“与年龄相关变化的某种程度弹性”。  研究人员发表在《美国国家科学院院刊》上的最新研究报告中指出,该研究将有助于解释为什么随着
看惯俗常物事,无非是怀念里的旧,时光里的久。无非是簇新的事物延续旧物的生长。最后,生和死都一同变旧。  我看到院子的門往往虚掩。  一些早晨,或者饭后,事物出现幻象。我走进软草:没有移动的日常混杂了干草的气味。在软草,一年就是一天,父亲就是母亲。一阵风吹,风中有人叫我的名字,我看见我睡在一个木凳上。睡姿滑稽可笑,却又从容自得。我想,这小小的木凳应该是棵年长的树,我在树上,时间从树间跌落。而天空,天
8月4号,我离开了福建东山岛,结束了一个月的隐居生活,这也是我第一次独自远行,而离开,是为了更好地回去。   我曾设想,假如我没有热爱文学、不曾写诗,我不过是个身高150cm的普通乡村教师,可能早就嫁作他人妇相夫教子了。我最终会重复父母的生活模式,在洗洗刷刷、家长里短中度过此生。我不会经历那些跌宕起伏的命运,心灵也将被各种琐事尘封,永远看不见现实之外的天空。   我的文学之路从写诗开始,而写诗
春天,在一本書里打马归来  我用页码为她丈量归途,马蹄声惊起尘土  也惊起一场杏花雨,纷纷扬扬  每翻过一页,都会泄露  青草的唇语。从我手背上  开始流浪的那枚雪花  已不知所踪。春天在归来的路上  雪花,应该在通往春天的路上  我案头的烛火,熄灭之后  余温把第二天的太阳  高高举起,缓缓地撒下暖意  北风在这一天改变性情和去向  由南往北,或者自西向东  把鹅黄色的细叶迎上枝头,就像那个  
俗话说“流水的统治者,铁打的地球”,有着40多亿年历史的地球无论经历多少沧桑巨变、无论遭受多少灭顶之灾,自巍然不动,几十万年后“又是一条好汉”。但地球的历代“统治者们”可就没那么幸运了,从恐龙到新生代早期的巨兽,纷纷在天灾的袭击下退出了历史舞台。  作为当今地球统治者的人类,会不会走前几任统治者的老路呢?要知道,人类别的不多,就是不差钱,能不能通过拼命砸钱的方式“破财消灾”,逃过被灭绝的命运?如果
每年5月到9月,都是英国麦田怪圈现象频发的时节。2020年5月29日早上,竟出现了一个可怕的麦田怪圈。事发地点位于英格兰西南部的威尔特郡广阔无垠的麦田中,这里有着“麦田怪圈的麦加”的称号。  但是,当时的英国正处在以防御新型冠状病毒感染扩大为目标的封闭隔离状态中(封城),且并没有完全解除封锁,人们都在尽量避免大规模的聚集,所以具体的事发地点仍不清晰。  不过可以肯定的是,新出现的麦田怪圈,其形状酷