AI行业之战,得“视觉”者得天下

2017-05-22 14:42:17 来源: DeepTech深科技 热度:
“过去,自然界已经向我们展示了视觉是有智力的生物最强大的秘密武器之一,帮助它们在所处的复杂世界中探索、生存、互动并改造环境。人工智能系统也一样。网络超过八成的流量是照片、视频等像素格式数据,如今带摄像头的智能手机数量已经超过了地球人口,而每一台设备、机器以及我们所处的每一寸空间都将被智能传感器赋予力量,”李飞飞说道,“打造智能机器的唯一途径就是让它获得强大的视觉智能,就像生物在进化中所获得的那样。许多人都在寻找视觉的杀手级应用,而我要说,视觉是人工智能和计算的杀手级应用。”
 
社会在一定程度上被人们的自恋欲求推动——他们喜欢自拍,让别人看到自己穿什么、吃什么、在哪儿度假、和谁在一起。人们拍照的一个主要原因是通过视觉来交流。
 
今天的网上电子商务也是由图片和视频驱动,而未来它会由带摄像头的无生命物体凭借计算机视觉和人工智能来驱动。我们的冰箱里会有摄像头,汽车里到处都有摄像头,还有监控摄像头、管控花园用水量和室内温度的视觉传感器,等等。这些摄像头会从影像、热量、X射线、超声波、白光中分析许多不同类型的可视化数据,生成高品质的信息——我们前所未见的信息。
 
IBM的沃森机器人已经和North Face、Macy’s、Sears等零售商合作,用人工智能来大幅提升顾客的购物体验。我很讨厌购物。我是那种很多年都穿同一种款式的人。有些事会让我抓狂,比如我很喜欢一条红色的裤子,我穿了很多年,直到穿破了只能换新的了,我就去商场里找一样的裤子。我当然找不到了——他们已经不生产这条裤子了。
 
我一直幻想我的房间里能有个摄像头每天给我拍照,时间久了它就知道我的风格了。安装在家里的亚马逊Echo Look、谷歌助理(Assistant)等带摄像头的物体最终会帮助我们解决这个问题。
 
有计算机视觉和人工智能做后盾的摄像头应该会主动替我购物,不再需要我亲自上网搜或到店里找了。理想化的情形是这样的:亚马逊的Alexa会发一封邮件给我,说“你最爱穿的那条红裤子看起来已经撑不住了,你每天都穿这一条,我们发现屁股口袋上有个洞。我们觉得你会想知道,我们库存里有两条这样的裤子,同样颜色同样尺寸。要不我帮你下单买一条,或者两条都买下?”好哇!
 
只要摁一个下单键,它们就送到我家里了。我讨厌购物的难题就这么解决了。从此我是一个非常快乐的顾客,因为我再也不用找啊找的了。
 
我也讨厌买吃的和洗漱用品。假如我家里所有的摄像头一起发力,我就再也不会断粮了,那真是太棒了!最重要的是,我们再也不用耗费体力去找东西了,不管是在店里还是网上。
  

 
图丨现代家居中,摄像头无处不在,带来了海量数据
 
要处理家居摄像头生成的呈指数级增长的视觉数据,需要扩大存储和处理数据的基础设施的规模,这只是挑战之一。幸运的是,亚马逊拥有世界上最大的云计算网络之一。更艰难的战事是利用恰当的人工智能算法来解密和理解照片、视频等视觉数据中有价值的信息,从而使自家的人工智能技术获得最高的智商。
 
计算机视觉专家、康奈尔大学理工学院的瑟奇·贝隆(Serge Belongie)说:“人脑的大部分都参与处理视觉信息,使我们能够解读场景和探索空间等。视觉数据是我们了解世界的关键途径,也因此,对智能机器的追求将需要在处理和解读视觉信息的能力上实现大跃进。”
 
谷歌很快也会在Assistant上添加摄像头,可能会与它的智能恒温器Nest以及家居监控摄像头Dropcam相连接。卖点是你的自拍照和由摄像头网络所捕捉的其他视觉数据。
 
人工智能将从你的视觉数据中学习,取代上网搜索购物的过程。很多创业公司正在创建的电子商务都会利用独一无二的视觉数据和人工智能,这真是激动人心。大企业会竞相打造强大的摄像头,解读我们的视觉数据,让我们的生活变得更方便、有趣,也为它们带来更多利润。等着看,一场硬仗即将上演。

责任编辑:黄焱林

相关推荐

Telairity H.264 编码技术为2010年世界杯全球高清/标清转播提供支持

DVBCN消息2010年7月7日电--Telairity卓越的H.264编码技术是为全球近十亿人观看2010年世界杯足球赛提供支持的“秘密要素”。整个亚洲、南太平洋以及世界杯主办国南非的观众都是依靠Telairity的H.264/AVC编码器来收看高清(HD)和标清(SD)比赛转播的。有了Telairity的H.264现代技术,世界各地的网络运营商和广播、卫星及有线电视公司可以更换掉旧的MPEG-2压缩系统,为客户提供更出色的视频质量并显著降低对带宽的依赖,从而大幅减少传输成本。泰国国营电信公司CATTelecomPublicCompanyLimited安装了Telairity高清和标清编码器

ST高清电视系统级芯片获Adobe AIR for TV认证

意法半导体(STMicroelectronics,简称ST)宣布,其先进的高清电视系统级芯片(SoC)平台取得了巨大进步,此项成果将意法半导体推向能够运行基于Adobe®AIR®的游戏和其它应用软件的下一代互联网电视技术的最前沿。意法半导体已成功移植AdobeAIR®2.5forTV软件至第三代先进互动高清机顶盒系统芯片平台,并通过Adobe产品认证。AdobeAIR软件是AdobeFlash平台的一个重要组件,原始设备制造商(OEM)、原始设计制造商(ODM)、服务开发人员以及应用开发人员能够在这个平台开发丰富的网络应用软件和游戏,专门为机顶盒和数字电视等嵌入式设备和

把面向数字家庭的Adobe Flash引进到MIPS-Based平台

TriplePlayIntegration销售副总裁MikeNottage什么是三重播放集成?TPI公司是一家致力于提供数字家庭视频平台解决方案的专业软件服务公司。TPI公司还是官方Adobe的“ScalingPartner”,为消费电子平台提供FlashPlayer10、AIR和舞台美术技术提供优化的端口。我们有25名具有专业的项目管理和质量保障经验的高级工程师团队,平均具有24年的工作经验.你们能够提供什么样的

Alan Tsai:移动终端GPU之趋势与迷思

DVBCN数字电视中文网讯(敖瑞),2012年6月15日(周五),由ARM主办的“跨界、变革、多赢——ARM移动智能终端研讨会暨应用开发者大会”在上海举行。本次约有20名厂商代表上台演讲;参会并参与展示会的厂商超过30家,均为ARM在各个领域的合作伙伴。ARM亚太市场开发经理AlanTsai做出了“移动终端GPU之趋势与迷思”的精彩演讲。Alan表示:在用户体验上来说,分辨率已经可以高达人眼都无法辨析的地步了。公允的说,业界对GPU的评判标准存在太多的分歧:从三角形的角度来看,涉及到生成率、裁切率等指标,不同类型的GPU产品根本没法比;从填充率的角度上