腾讯云王琰：腾讯云AI Cloud的技术、应用布局和趋势

4月21日，TEF科技娱乐季（上海站）之2017亚太人工智能峰会在上交会期间隆重举行。大会由AI科学创新与未来、AI深度学习专场、AI语音与视觉识别技术、AI无人驾驶引领汽车、AI与教育、AI与家庭娱乐、AI与计算机视觉、AI与VR、AI与物联网等板块组成。会上，腾讯云AI产品副总监王琰做了题为《腾讯云AI Cloud》的精彩演讲。

图为：腾讯云AI产品副总监王琰

AI发展史：是什么造就了今天的人工智能

王琰在演讲开头提到，人工智能是近年来非常热门的话题，高密度的讨论足以说明人工智能人气之旺，也反映了其市场热度。人工智能的概念从上世纪60年代就已产生，经过起步阶段、专家系统推广、再到如今深度学习阶段。2006年开始由于深度学习神经网络的出现，AI进入了高速发展期。进入2016年，在图象视觉、语音技术上面的重大算法突破加快了AI的市场化进程。

演讲中，王琰提出了她自己思考，为什么人工智能的飞跃会出现在今天？究其原因，王琰认为主要体现在三个方面：第一是计算能力增强。使用GPU并行计算神经网络，更大的硬件存储能力使得创造出更大的神经网络变成可能。第二是大数据出现。互联网时代的到来产生大量数据，训练数据量的增大可以让神经网络更好的学习，提升算法性能。第三是新算法推出。新算法可以提前训练网络，避免网络受层数的限制；更好的方法用来估算参数，可以使网络在更短时间内做得更精准。王琰说，人工智能就像我们的另一个大脑。

腾讯公司AI初探

腾讯作为一个互联网公司，在AI领域一直都有非常深入的探索。过去腾讯公司会结合已有的应用场景，包括腾讯自己的社交软件、游戏、搜索引擎、广告等实现在AI领域的探索，随着AI概念的更新，腾讯也不断进行新场景的应用探索。

1、腾讯人工智能业务应用

第一是微信。语音输入是腾讯在微信AI的大胆尝试。通过在输入框输入语音，语音就可以转化为文字。看似是一个非常简单的AI应用，背后却隐藏着复杂的语音识别算法。其次是在QQ音乐里的尝试。当我们听到一首歌但却不知道歌的作曲和演唱者的时候，就可以通过简单的哼唱将这首歌在曲库里面找出来。第三是腾讯优图。腾讯优图是基于图象和人脸深入研究的人工智能研发团队。它的应用场景主要是社交中的智能鉴黄，基于过去建立的庞大黄色图库，优图团队研发的智能鉴黄机器人可以达到99.95%的识别率。第四是腾讯的滨海大厦，主要应用技术是刷脸门禁。进门不需要刷卡，只需要小机器人做刷脸，甚至不需要正面，侧面都可以识别出来。

2、腾讯AI LAB与腾讯云

2016年开始腾讯公司也开始了AI战略布局，其目标是让腾讯的AI LAB成为全世界顶尖的AI研究机构。成立不到一年，腾讯AI LAB就推出了围棋机器人，在3月18日举办的第10届UEC杯世界计算机围棋大赛上，首次亮相的“绝艺”11战全胜夺得冠军，充分体现了腾讯在AI技术研究方面的实力。腾迅云一直以来拥抱开放，主要做连接和生态，把腾迅过去海量的互联网经验、先进的技术通过这个平台开放出来，连接更多的行业和应用。在云上拥有了资源、数据和算法之后，除了应用在腾讯自身的应用上，也通过AI cloud把这些能力分享给客户，以产生更多的市场价值。

3、腾讯云AI Cloud 服务矩阵

简单来说，腾迅云AI Cloud服务矩阵服务三类目标群体，一个是基础研究。基础研究员可以通过云服务器以及深度学习平台快速搭建一个学习环境，以加速技术研究。其二是对应用开发者，通过对外开放图象识别、语音识别接口，可以让开发者在应用中使用一些具有一定实力的人工智能能力。第三是与行业融合，结合云计算本身的资源优势以及在AI上的技术实力，给大家提供垂直的行业解决方案。

4、DI-X深度学习平台

DI-X深度学习平台是基于腾讯云强大计算能力的一站式深度学习平台。通过可视化的拖拽布局，组合各种数据源、组件、算法、模型和评估模块，让算法工程师和数据科学家在其之上，方便地进行模型训练、评估及预测。目前支持 TensorFlow、Caffe、Torch 三大深度学习框架，并提供相应的常用深度学习算法和模型。

腾讯AI战略布局：打造全方位技术包围

优图计算机视觉

优图计算机视觉在ICDAR 2015比赛中刷新Focused Scene Text挑战的Text Localization项目世界纪录；在LFW无限制条件下人脸验证测试中，优图提交的最新成绩为99.80%，再次在这一测试中刷新纪录；在国际权威海量人脸识别数据库MegaFace中，以83.290%的最新成绩在100万级别人脸识别测试中拔得头筹。

智能语音识别

智能语音识别由四部分组成，分别是语音识别、语音合成、语音唤醒和声纹识别。除此之外，腾讯还在一些垂直领域做了深耕，除了标准的一些社交场景之外，也在法院、安全、医疗等场景有了语音方面的垂直引擎。

人脸核身解决方案

今年央视的“三一五”晚会上介绍的人脸核身方案，已经被黑产突破防护，并可以伪造身份。优图团队独创的语音+唇动活体检测技术，可以抵抗照片、视频、静态3D模型的攻击，不受方言甚至语种的影响。它的流程主要是身份证扫描出身份证号，同时录一段视频，产生一段随机的验证码，再和身份证图像对比。其实，在优图实验室已经组成了一个专门进行黑产对抗的团队，增强安全能力。除了常用的工程上的随机性，实时的自然交互，同时还在算法上捕捉一些人眼看不到的伪造和差距。目前腾讯的“人脸核身”解决方案已经在互联网上有所应用，比如金融领域、滴滴租车等。

手写运单OCR识别解决方案

在手写体识别和通用印刷体识别实验中，手写体手机/电话识别准确率可达99%以上，在业界突破复杂手写体识别的难题；通用场景单字准确率超过90%，在国际ICDAR 2015文本检测项目中刷新世界纪录；可应用在各类印刷体识别，如广告、菜单、驾照等，以及定制化手写识别场景。

智能相册解决方案

智能相册解决方案主要是用在社交场景，从QQ相册和微云相册演化而来。当在手机上上传照片的时候可以马上归类到某个文件夹，分辨其是小猫、小狗还是一个小孩，即通俗的智能分类技术。目前腾讯可以提供面向社交场景的超过200种的热词分类。同时基于特殊行业的定制化标签，也可以通过快速学习的方式实现很快地支持这个标签。

智慧法庭语音解决方案

随着人民法律意识的提高人民法院的案件审理数日益增加，庭审效率亟待提高，而庭审现场记录的百分百还原一直以来都无法实现。通过在法庭现场应用语音识别，可以将法官、原告、被告等各角色的现场发言实时转写成文字笔录，并对录音及文本进行存储，减轻书记员工作负担的同时实现了庭审现场的百分百还原。专业法务领域定制化引擎，有效应对法律专业术语。支持自定义热词，提升人名、机构名、公司名等词汇识别准确率。个案定制话模型，满足物理、化学等专业领域司法案件的高准确率需求。私有化部署，保证人民法院的数据安全性。目前该系统识别准确率已经达到95%以上，在北京知识产权法院、河北高级人民法院、珠海中级人民法院等20余家法院部署应用。

除了上述方案，腾讯云还提供安防监控解决方案、智能直播审核解决方案等，真正实现技术上的全包围，为当前国内的人工智能发展开出一条血路。

演讲的最后王琰提到，现在的人工智能应用已经趋于成熟，但主要集中在商业领域里，未来将更多的在公共领域进行开发，比如教育、医疗、智慧城市、智能家居等。

腾讯云王琰：腾讯云AI Cloud的技术、应用布局和趋势

24小时排行