传感器与机器学习:应用如何实现看、听、触、嗅、尝

来源 :计算机世界 | 被引量 : 0次 | 上传用户:wenping1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  这五种感觉是以传感器和数学算法的方式实现的,通常为受监督的机器学习算法和模型。
  得益于深度学习、机器学习、更快CPU和新型传感器,计算机如今已经能够看到、听到、触到、嗅到、尝到和说出来。这五种感觉都是以传感器(如摄像头)和数学算法的方式实现的,通常为受监督的机器学习算法和模型。
  看 图像和人脸识别
  近期对图像和人脸识别的研究让计算机不仅能够检测物体的存在,还能够检测相似物体的多个实例。Facebook和谷歌通过多个开源版本实际上已经处于领先地位。Facebook表示他们的目标是在视频中检测物体。
  近年来,这一领域已经取得了很大进展,图像中的物体能够被从其他物体中分离出来。雖然我们能够发现东西并将它们从另的东西中分离出来,但是并不意味着我们知道这个东西是什么。这就需要能够识别这些东西的训练模型。
  目前已经出现了一些强大的工具,不过这些工具需要非常多的数据。因此Facebook和谷歌能够公布这些工具,从研究和社区开发的衍生工具中获得好处,而不用担心该领域内有太大的竞争。简而言之,很少有机构有数以百万或数以亿计的图像可以提供给这些工具,并为此提供专用的计算力。
  本质上,用机器或深度学习将物体分类是“看”绵羊或小猫的第一步,包括各种衍生物(如大的、小的、有毛的、毛少的、瘦的、胖的、尾巴的)。然后是训练模型识别所有的这些变体。
  虽然Facebook和谷歌投入了极大的精力,不过这一领域内还有其他一些工具,如汇集了许多功能的OpenCV库以及将重点入在了人脸识别上的OpenFace。
  甚至还出现了名为Jevois(法语意思为“我看到”)的智能摄像头。这种摄像头为Arduino设备专用的摄像头,后者拥有基于开源库的预训练模型。它们被训练识别大约1,000种不同的物体。我们可以用自己的模型进行调整。因此如果我们计划建造一个可以自主飞行的四轴飞行器,那么我们的计划将很可能会实现。
  听 语音识别和声音
  分类
  计算机的“听”更多的是关于语音识别。尽管如此,声音分类是可能的。虽然Shazam(一款专业的音频识别软件)是其中的杰出代表,但是针对普通声音分类的模型还不好用,或是没有我们预期的那么丰富。PyAudioAnalysis可让我们录制.wav格式的文件并对声音进行分类。
  你能抓住鸟的叫声或是马路噪音吗?与图像识别一样,这意味着训练一个分类模型。这一领域目前似乎还缺乏投资。或许是因为Facebook主要使用的是图像和文字等静默交流方式,谷歌也只推出了video.google.com 和 images.google.com,而没有推出sounds.google.com的原因。
  在语音识别方面,我们能够找到一些使用传统的隐马尔可夫模型的开源工具,如CMUSphinx和使用神经网络的Kaldi。此外还有一些其他的工具,但是问题出在在线和离线解码之间。“在线”意味着你能读取麦克风,“离线”意味着在获取.wav文件之前必须等待。
  IBM、谷歌、苹果和微软等主要厂商都有着各自的工具。谷歌在这方面做的非常出色,我们甚至可以通过带有 JavaScript的浏览器进行语音识别。
  触 一种极端缺乏
  公共技术的感觉
  关于触觉,似乎很少有关于如何使用触摸传感器进行“感知”的资料。它们主要被应用在控制应用中(如以前的任天堂能量手套,许多人都想拥有一套,但是又非常的不好用。)
  目前已经出现了针对Arduino和相应库的“did you touch it”传感器,以及用于检测动作的传感器。最具前景的“did you touch it”创新是电容织物。尽管如此,在一台“触摸表面查看是否有缺陷”的实用型机器上,大部分都是光学或超声波应用。
  嗅 电子鼻子
  是的,计算机也能够闻到气味。目前这方面已经有了许多实际应用。“电子鼻子”的出现已经有一段时间了。
  最便宜的办法是将一个传感器接入Arduino设备中并“吸入”气体。根据吸入气体的量,它们能够“检测出”啤酒中使用的啤酒花等东西或是空气是否有毒。这些技术已经被应用到了炸弹嗅探和质量控制等方面。
  尝 另一种极端缺乏
  公共技术的感觉
  对于计算机来说“味觉”是什么?这是一种主观感觉,许多人的味觉实际上是嗅觉。这里的传感器多为化学、微生物、pH值和滴定传感器。这方面的实际应用非常广泛,比如检测你是否生病,体内葡萄糖水平是否充足或是是否中毒等。
  就像人体解剖学一样,其又与嗅有着很大的重叠。这里几乎没有什么公开的源代码,训练一个模型可能意味着要访问化学实验室或来自化学实验室的数据。
  我们还无法创建Data指挥官
  有了这五种感觉,我们能否创建电影《星际迷航:下一代》中的Data指挥官,或是至少是他那愚蠢的堂弟B4(因为我们还没有通用人工智能)?答案是可能还无法实现。即便我们有了这些传感器和库,我们在各个方面还没有经过充分训练的模型。它们需要非常多的数据,并且其中许多对于实时使用来说速度也跟不上。
  因此,目前我们仍然在致力于在视频中进行人脸识别。触觉主要还依赖于“did you touch it?”传感器或是其他单一用途的传感器。嗅觉的情况也大致相同,味觉的情况最为糟糕。
  不过,像机器学习和深度学习一样,对于我们的单一用途的应用(比如,咖啡变质了吗?),人工智能和传感器已经取得了很大的进展。也许计算机的五种感觉不会达到人类的水平,但是它们会拥有这些感觉。目前已经出现了许多可供开发者使用的免费和专利工具。
  本文作者Andrew C. Oliver为企业搜索解决方案提供商Lucidworks的技术支持经理。
  原文网址
  https://www.infoworld.com/article/3267153/machine-learning/sensors-and-machine-learning-how-applications-can-see-hear-feel-smell-and-taste.html
其他文献
5个内存计算平台功能,支持对数据湖数据和操作流的分析处理。  当今的分析需求给现有数据基础设施带来了前所未有的压力。能否跨操作和存储数据执行实时分析对业务成功来说非常重要,但实现起来总是充满挑战。  有一家航空公司,他们希望收集并分析其喷气发动机的连续数据流,以实现预测性维护,更快地解决问题。每台发动机都有数百个传感器,用于监测温度、速度和振动等参数,并将这些信息不断地发送到物联网(IoT)平台。
10月20日,15项闪耀全球的世界互联网领先科技成果在浙江乌镇召开的第六届世界互联网大会上发布,这些成果有望为人类生活、科技进步、经济发展、社会变革赋予强大动力。  这15项成果是鲲鹏920处理器、面向通用人工智能的异构融合天机芯片、统一自然语言预训练模型与机器阅读理解、360全视之眼——0day漏洞雷达系统、特斯拉完全自动驾驶芯片、飞桨深度学习平台、基于存储计算分離与分布式共享存储架构的云原生数
数字化转型(DX)指将处理流程和服务数字化让业务更为灵活,运营更为高效,涵盖了从为客户提供服务到与供应链合作伙伴共同改进流程等方方面面。营销团队想要改变产品的推广方式,人力资源部门希望提升人员招聘质量,IT团队则想要迅速迭代在线服务。  为了启动DX项目,企业需要在设计和策划阶段将人员、程序和技术集中起来,让他们知道数据分析、物联网、移动和社交等技术将在何处发挥重要作用,然而信息安全却经常被排除在
11月30日,江苏常州。当日,全国首张智能网联商用汽车开放道路测试牌照在江苏省常州市颁发,三家车企获得首批发放的三张路测牌照。图为取得牌照后,全国首辆自动驾驶电动巴士在开放道路进行载人测试。   国家ITS中心智能驾驶及智能交通产业研究院正式获批颁发牌照的资质,成为全国唯一具有该资质的单位。   智能网联汽车是指车联网与智能车的有机联合,是搭载先进的车载传感器、控制器、执行器等装置,并融合现代
11月12日,工信部披露2019年前三季度我国软件行业的运行情况。工信部表示,前三季度我国软件业完成软件业务收入51896亿元,同比增长15.2%,增速同比提高0.2个百分点。前三季度,全行业实现利润总额6518亿元,同比增长10.8%,增速较上半年提高0.9个百分点。  前三季度,信息技術服务实现收入30670亿元,同比增长17.2%,在全行业收入中占比为59.1%。其中,云服务收入同比增长12
文章编号:1005-6629(2008)12-0011-02  中图分类号:G633.8  文献标识码:C    纳米碳管是一种重要的低维纳米材料,作为科普知识,纳米碳管已在各种中学化学相关的课外学习资料中频繁出现。美国JCE杂志在2006年介绍过一种利用闪光让碳纳米管反应着火的课堂演示实验;《化学教学》曾经刊载两篇与纳米碳管有关的实验:沈海军老师给出一种纳米碳管模型的制作方法,该模型可为中学化学
“目前中金数据在全国共建设和运营4个数据中心,分别在北京、山东烟台、湖北武汉和江苏昆山花桥,可以支撑10万个机柜的运营规模。中金华东数据中心是中金数据系统有限公司部署在华东地区的数据中心核心节点,总规划建筑面积30万平方米,未来全部工程投产后可部署约37600台机柜。”  7月18日,在“新基建,新机遇”——数据中心发展研讨会暨中金华东数据中心二期开工仪式上,中金花桥数据系统有限公司总经理杨雨向来
近日,腾讯与敦煌研究院携手启动“数字丝路”计划这次合作是国家文物局与腾讯战略合作协议签署后首个落地的项目。据了解,腾讯将从新技术和泛娱乐文化生态两个维度与敦煌研究院的“数字敦煌”研究成果和文化服务模式等两个领域相结合,在AR/VR、云计算、智慧旅游、游戏、动漫、音乐六大模块深度合作,赋能经典文化,推动数字丝路上的文化保护与交流。  敦煌研究院積累了20多年的数字化资源,“数字敦煌”资源库中文版和英
移动化趋势从消费级向企业级的演进不仅革新了办公方式,同时也对IT架构产生了深远的影响。  BYOD,即英文“Bring Your Own Device”,指的是携带自己的设备办公,这些设备包括个人电脑、手机、平板等,而更多的情况指手机或平板这样的移动智能终端设备。  最新数据表明,2014-2018年国内企业级移动解决方案市场复合增长率将达到20%,其中,发展最快的是企业移动管理市场,未来几年在国
生物认证技术通过每个人特有的生理特征,如指纹、掌纹、人脸、虹膜等,或行为特征,如笔迹、语音等进行身份认证。由于这些特征在很大程度上具有唯一性和不可模仿性,极大地减少了用户被冒名顶替的风险。 随着生物认证技术的发展成熟,在很多领域已经得到了成功的应用。 键盘作为计算机的标准外设是普通计算机都有的,能否以人们不同的击键习惯作为特征,认证击键者的身份呢? 基于人们的击键输入方式对人进行识别或者身份认证并