论文部分内容阅读
很多人越来越习惯通过语音助理与自己的电脑、手机和智能扬声器“聊天”,比如亚马逊Alexa、苹果Siri、微软Cortana和谷歌助手。

不识字的农民Yacouba Sawadogo正在测试移动网络上的语音服务
几十年来,盲人和弱视群体一直在使用文本转语音转换器。有些人认为,语音很快就可以代替打字和点击,成为在线互动的主要方式。那么,向“语音网络”转化将面临哪些挑战?
如果您无法阅读,那么网络的文字内容有什么用处?这是加纳不识字的农民所面临的境况,他们也因而无法接收互联网向其他多数人提供的重要信息。
“鉴于加纳北部的识字率只有22.6%,农民们常常以低于市场标准的价格出售其农产品,因为他们可能没有意识到时下的价格。”弗兰西斯·迪托表示,他是语音天气信息服务商Mr Meteo的研究员。
“最常见的投诉是关于天气预报,”住在加纳北部塔马利的迪托先生说。
“农民告诉我们,他们的祖先用来预测天气的方法现在似乎不管用了。”他认为这是气候变化导致的。预知何时下雨对于想播种、灌溉作物或放牧的农民来说至关重要。
迪托说,将在线天气报告转换成语音的想法来自农民自己,他们在Guabuligah村召开一次研讨会之后提出了这个想法。
Mr Meteo发布在线天气预报,将其转换为能在普通手机上播放的简短录音。农民拨打电话接收信息。在加纳,有120万人使用当地语言Dagbani,但谷歌翻译却不提供该语种的翻译服务。
迪托说,规划这个服务的初衷就是便宜且易于操作。
语音网络还可以帮助欧美五分之一阅读能力差的成年人,在阿姆斯特丹工作的大学研究员安娜·波恩说,她曾在马里和布基纳法索从事“网络到语音”系统的早期原型开发工作。
但是建立语音网络——“网络到语音”和“语音到网络”——并非易事。“理解意大利餐厅供应披萨很容易,”语音识别公司Nuance的研究主管尼尔斯·伦克说,“要覆盖多个领域并且能够在每个主题上都能与用户对话,实现起来仍然遥遥无期。”
因此,尽管Alexa和其他类似服务可以回答简单的天气问题并为我们播放音乐,但大多数专家都认为,要进行各种内容宽泛的对话还需要几十年才能实现——人工智能还不够聪明。
就连将一个人的声音转化为文字,即自动语音识别,仍是“有待解决的最大的难题之一,因为全世界的语言太多了,发音各不相同”,位于巴黎的语音创业公司Snips的创始人兰德·因迪如是说。

几十年来,盲人和弱视群体一直在使用文本转语音转换器。有些人认为,语音很快就可以代替打字和点击,成为在线互动的主要方式。那么,向“语音网络”转化将面临哪些挑战?
为农民播报天气
如果您无法阅读,那么网络的文字内容有什么用处?这是加纳不识字的农民所面临的境况,他们也因而无法接收互联网向其他多数人提供的重要信息。
“鉴于加纳北部的识字率只有22.6%,农民们常常以低于市场标准的价格出售其农产品,因为他们可能没有意识到时下的价格。”弗兰西斯·迪托表示,他是语音天气信息服务商Mr Meteo的研究员。
“最常见的投诉是关于天气预报,”住在加纳北部塔马利的迪托先生说。
“农民告诉我们,他们的祖先用来预测天气的方法现在似乎不管用了。”他认为这是气候变化导致的。预知何时下雨对于想播种、灌溉作物或放牧的农民来说至关重要。
迪托说,将在线天气报告转换成语音的想法来自农民自己,他们在Guabuligah村召开一次研讨会之后提出了这个想法。
Mr Meteo发布在线天气预报,将其转换为能在普通手机上播放的简短录音。农民拨打电话接收信息。在加纳,有120万人使用当地语言Dagbani,但谷歌翻译却不提供该语种的翻译服务。
迪托说,规划这个服务的初衷就是便宜且易于操作。
人工智能还不够聪明
语音网络还可以帮助欧美五分之一阅读能力差的成年人,在阿姆斯特丹工作的大学研究员安娜·波恩说,她曾在马里和布基纳法索从事“网络到语音”系统的早期原型开发工作。
但是建立语音网络——“网络到语音”和“语音到网络”——并非易事。“理解意大利餐厅供应披萨很容易,”语音识别公司Nuance的研究主管尼尔斯·伦克说,“要覆盖多个领域并且能够在每个主题上都能与用户对话,实现起来仍然遥遥无期。”
因此,尽管Alexa和其他类似服务可以回答简单的天气问题并为我们播放音乐,但大多数专家都认为,要进行各种内容宽泛的对话还需要几十年才能实现——人工智能还不够聪明。
就连将一个人的声音转化为文字,即自动语音识别,仍是“有待解决的最大的难题之一,因为全世界的语言太多了,发音各不相同”,位于巴黎的语音创业公司Snips的创始人兰德·因迪如是说。
