除了当局的重视以外,许多科技行业也积极布局人工智能产业,通过通过巨额的研发投入、组织架构的调整、持续的并购和大量的开源项目,正在打造各自的人工智能生态圈。下文DVBCN就给大家盘点全球科技企业中,对于人工智能产业的发展布局。
百度
2014年5月,被称为“谷歌大脑之父”的AndrewNG(吴恩达)加盟百度,担任首席科学家,负责百度“百度大脑”计划。大数据是人工智能的基础,而作为天然的大数据企业,百度拥有强大的数据获取能力和数据挖掘能力。2014年7月14日,百度凭借自身的大数据技术14场世界杯比赛的结果预测中取得全中的成绩,击败了微软和高盛。2014年9月,百度正式发布整合了大数据、百度地图LBS的智慧商业平台,旨在更好在移动互联网时代为各行业提供大数据解决方案。同时,布局布局语音识别和图像识别系统;积极推进无人驾驶项目;2016年8月,推出“人工智能解说员”,完成人机同台解说。
AI技术:语音识别Deep Speech、视觉识别“智能读图”、自然语言与智能语义、自动驾驶、深度学习
解决方案:基于智能手机的语音服务系统(度秘)
开发者云平台: 百度云
产业布局:汽车领域无人驾驶、基于智能手机的各种app应用与插件。
腾讯
AI技术:视觉、智能计算与搜索实验室
产业布局:智能硬件
阿里巴巴
2016年8月阿里云宣布推出人工智能——ET,ET基于阿里云强大的计算能力,正在多个领域不断进化,目前已具备智能语音交互、图像/视频识别、交通预测、情感分析等技能。
云平台:(阿里云IaaS,可视化人工智能平台DTPAI)
产业布局 :智能家具、物联网
Amazon
2015年收购具有图片识别技术的人工智能初创企业Orbeus;曾花重金打造新的线上的网页服务和仓库自动化。
云平台:Amazon Web Services(存储、计算、模式识别和预测,其中视频识别API 收购Orbeus)
IBM
IBM Watson由90台IBM服务器、360个计算机芯片组成,是一个有10台普通冰箱那么大的计算机系统。它拥有15TB内存、2880个处理器、每秒可进行80万亿次运算。现在已经逐步进化到四个批萨盒大小,性能也提升了240%。Watson存储了大量图书、新闻和电影剧本资料、辞海、文选和《世界图书百科全书》等数百万份资料。Watson是基于IBM“DeepQA”(深度开放域问答系统工程)技术开发的。DeepQA技术可以读取数百万页文本数据,利用深度自然语言处理技术产生候选答案,根据诸多不同尺度评估那些问题。IBM研发团队为Watson开发的100多套算法可以在3秒内解析问题,检索数百万条信息然后再筛选还原成“答案”输出成人类语言。
产业布局:IBM公司自2006年开始研发Watson,并在2011年2月的《危险地带》(Jeopardy!)智力抢答游戏中一战成名。一开始IBM想把Watson打造为超级Siri,主要还是卖硬件。但是后来转型为认知商业计算平台,2011年8月开始应用于医疗领域。
2012年3月,Watson则首次应用于金融领域,花旗集团成为了首位金融客户。Watson帮助花旗分析用户的需求,处理金融、经济和用户数据以及实现数字银行的个性化,并帮助金融机构找出行业专家可能忽略的风险、收益以及客户需求。
硬件:人脑模拟芯片SyNAPSE
SyNAPSE(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,即“自适应塑料可伸缩电子神经形态系统”)芯片,含有100万个可编程神经元、2.56亿个可编程突触,每消耗一焦耳的能量,可进行460亿突触运算。在进行生物实时运算时,这款芯片的功耗低至70毫瓦(mW),比现代微处理器功耗低数个数量级。
成立了人工智能研究团队,并专注于图像识别领域。收购的初创企业都与人脸识别技术有关,例如Face.com人脸识别网站。在新的Facebook应用中,用户可以利用人工智能技术自动生成每张照片的说明,可以帮助盲人“听”到照片。另外;Facebook还收购了一家名为WIT.ai的公司,可以为开发者提供自然语言应用程序接口。
2013年12月,Facebook成立了人工智能实验室,聘请了卷积神经网络最负盛名的研究者、纽约大学终身教授Yann LeCun为负责人。Yann LeCun是纽约大学终身教授,是卷积神经网络领域的重要推动者,而该技术的最主要应用就是图像识别的自然语言处理,这与Facebook的需求和已经积累的数据类型非常匹配。在Yann LeCun的帮助下,2014年Facebook的DeepFace技术在同行评审报告中被高度肯定,其脸部识别率的准确度达到97%。而他领导的Facebook人工实验室研发的算法已经可以分析用户在Facebook的全部行为,从而为用户挑选出其感兴趣的内容。
AI技术:视觉DeepFace技术(收购http://face.com)、语音识别(收购Mobile technologies)、自然语义(收购Wit.AI)、神经网络训练+机器学习
云平台:开发者平台Parse、Torch开源深度学习模块
硬件: Big Sur(基于GPU的用于训练神经网络的硬件系统,开源)
产业布局:语音助手Moneypenny、VR生态(收购Oculus Rift、Sourroud360全景摄像机促进内容发展)
Apple
收购了创业公司Gliimpse ,该公司的业务是使用机器人学习技术帮助人们安全地管理和共享个人医疗信息。
AI技术:自然语言(收购Vocal IQ)、收购可视化地图MapsenseGPS公司 Coherent Navigation
产业布局:汽车领域无人驾驶、SIRI语音助手
Microsoft
与人工智能行程安排服务创业公司 Genee 签署收购协议,收购后 Genee 将把人工智能技术整合进微软的 Office 365 中,并在9月1日关停Genee的服务。
AI技术:语音、视觉、自然语言、分布式机器学习
云平台:Microsoft Azure(存储、计算、数据库、live、媒体功能)、分布式机器学习工具包DMTK(自然语言处理,推荐引擎,模式识别,计算机视觉以及预测建模等)、人工智能平台Project Malmo
产业布局:语言助手(微软小冰、Cortana小娜、Tay)、VR(Hololens全息眼镜)
谷歌在一系列人工智能相关的收购中获益。2013年3月,谷歌以重金收购DNNresearch的方式请到了深度学习技术的发明者Geoffrey Hinton教授。2014年年初,谷歌以4亿美元的架构收购了深度学习算法公司——DeepMind,也就是推出AlphaGo项目的公司。该公司创始人哈萨比斯是一位横跨游戏开发、神经科学和人工智能等多领域的天才人物。
云平台:TensorFlow数据库,机器学习的核心是让机器读懂数据并基于数据做出决策。当数据规模庞大而又非常复杂时,机器学习可以让机器变得更聪明。TensorFlow在数据输入和输出方面都有惊人的精度和速度,它被确切地定义为人工智能工具。
产业布局:谷歌无人驾驶汽车、基于Android智能手机的各种app应用与插件、智能家居(以收购的NEST为基础)、VR生态、图像识别(以收购的Jetpac为基础)。
驱动人工智能发展的先决条件
物联网——物联网提供了计算机感知和控制物理世界的接口和手段,它们负责采集数据、记忆、分析、传送数据、交互、控制等等。摄像头和相机记录了关于世界的大量的图像和视频,麦克风记录语音和声音,各种传感器将它们感受到的世界数字化等等。这些传感器,就如同人类的五官,是智能系统的数据输入,感知世界的方式。而大量智能设备的出现则进一步加速了传感器领域的繁荣,这些延伸向真实世界各个领域的触角是机器感知世界的基础,而感知则是智能实现的前提之一。
大规模并行计算——人脑中有数百至上千亿个神经元,每个神经元都通过成千上万个突触与其他神经元相连,形成了非常复杂和庞大的神经网络,以分布和并发的方式传递信号。这种超大规模的并行计算结构使得人脑远超计算机,成为世界上最强大的信息处理系统。近年来,基于GPU(图形处理器)的大规模并行计算异军突起,拥有远超CPU的并行计算能力。
从处理器的计算方式来看,CPU计算使用基于x86指令集的串行架构,适合尽可能快的完成一个计算任务。而GPU从诞生之初是为了处理3D图像中的上百万个像素图像,拥有更多的内核去处理更多的计算任务。因此GPU天然具备了执行大规模并行计算的能力。云计算的出现、GPU的大规模应用使得集中化的数据计算处理能力变得前所未有的强大。
大数据——根据统计,2015年全球产生的数据总量达到了十年前的20多倍,海量的数据为人工智能的学习和发展提供了非常好的基础。机器学习是人工智能的基础,而数据和以往的经验,就是人工智能学习的书本,以此优化计算机的处理性能。
深度学习算法——最后,这是人工智能进步最重要的条件,也是当前人工智能最先进、应用最广泛的核心技术,深度神经网络(深度学习算法)。2006年,Geoffrey Hinton教授发表的论文《A fast learning algorithm for deep belief nets》。他在此文中提出的深层神经网络逐层训练的高效算法,让当时计算条件下的神经网络模型训练成为了可能,同时通过深度神经网络模型得到的优异的实验结果让人们开始重新关注人工智能。之后,深度神经网络模型成为了人工智能领域的重要前沿阵地,深度学习算法模型也经历了一个快速迭代的周期,Deep Belief Network、Sparse Coding、Recursive Neural Network, Convolutional Neural Network等各种新的算法模型被不断提出,而其中卷积神经网络(Convolutional Neural Network,CNN)更是成为图像识别最炙手可热的算法模型。
人工智能的四大功能
语音识别——李开复博士当年做的工作奠定了很多当今识别系统的基础。这里忍不住说一下,Siri本身的技术并没有特别大的亮点,真正nb的是它的模式(语音识别直接与搜索引擎结合在一起,产品体验做得好。而且关键是这样的模式能采集到更多数据,使得系统的精度越来越高)
自然语言理解——目前看到的最强的结果应该是IBM Watson。但其实我们现在用的搜索引擎、中文输入法、机器翻译(虽然其实还不怎么work)都和自然语言理解相关。这块儿不是我的专业,请 @段维斯 同学补充。
数据挖掘——随着近年数据量的疯狂增长,数据挖掘也有了长足进步。最具有代表性的是前几年著名的Netflix challenge(Netflix公司公开了自己的用户评分数据,让研究者根据这些数据对用户没看过的电影预测评分,谁先比现有系统好10%,谁就能赢100万美元)最后这一比赛成绩较好的队伍,并非是单一的某个特别nb的算法能给出精确的结果,而是把大量刻画了不同方面的模型混合在一起,进行最终的预测。
计算机视觉——目前越来越多的领域跟视觉有关。大家可能一开始想到的都是自动驾驶。虽然大家都在说googleX的无人车, 但实际上现在无论是商业上,还是技术整合上最成功的算法是Mobile Eye的辅助驾驶系统。这个公司也是目前computer vision领域最挣钱的公司。
从实现新功能方面说,视觉的发展的趋势主要有两方面,A) 集成更多的模块,从问题的各种不同方面,解决同一个问题(比如Mobile Eye,就同时使用了数十种方法,放到一起最终作出决策) B) 使用新的信息,解决一个原来很难的问题。这方面最好的例子是M$的Kinect,这个产品最让人拍案叫绝的就是那个红外pattern投影仪。
人工智能的应用领域
自然语言处理(包括语音和语义识别、自动翻译)、计算机视觉(图像识别)、知识表示、自动推理(包括规划和决策)、机器学习和机器人学。按照技术类别来分,可以分成感知输入和学习与训练两种。计算机通过语音识别、图像识别、读取知识库、人机交互、物理传感等方式,获得音视频的感知输入,然后从大数据中进行学习,得到一个有决策和创造能力的大脑。
人工智能引全球关注,中国顺应潮流
对科技的重视,是中国向来的发展战略。因此,我们可以看到国家不断在战略部署上出台加速人工智能需求的政策。例如,“人工智能”首次出现在“十三五”规划草案中,智能制造和机器人作为重大工程之一出现在“科技创新-2030项目”中,以及倡导“互联网+”落实及其核心技术的推广……可以预见,千亿元级的人工智能市场应用规模正在形成。
中国某些人工智能应用已达国际领先水平
中国在图像及语音识别的基础之上,即模拟神经网络的输入和输出,并通过大规模的数据进行训练,再对样本进行精准分类和预测,从而实现了“计算”之外的“思考”。这便是中国着力研究人工智能所得到的令人欣喜的结果。当然,研发中会遇到瓶颈,同时也是突破口——训练和建模逻辑的算法,但相信,只要不懈努力,我国定能取得更多更高的科研成就。
国内人工智能研发与应用范围着力3方面
“人工智能”的概念,是在1956年的美国达特茅斯(Dartmouth)大学召开的学术会议上被提出的。着眼全球,只在短短的60年间,科学技术的积累便使得机器学习、模式识别和人机交互这3个基础支撑能够得到较为广泛的应用。纵观我国,家庭机器人、工业或企业服务、智能助手3方面,是目前国内智能机器人行业的主要研发范围。就目前阶段而言,家庭服务机器人智能化程度还处于初级水平;以仓储和物流机器人应用为主的工业/企业场景应用最为广泛;而在工业机器人市场中,中国所占市场份额约为27%是最大的,市场前景开阔。
从上世纪八九十年代的PC时代,进入到互联网时代后,给我们带来的是信息的爆炸和信息载体的去中心化。而网络信息获取渠道从PC转移到移动端后,万物互联成为趋势,但技术的限制导致移动互联网难以催生出更多的新应用和商业模式。而如今,人工智能已经成为这个时代最激动人心、最值得期待的技术,将成为未来10年乃至更长时间内IT产业发展的焦点。