7月9日,全球人工智能与机器人峰会(CCF-GAIR)在深圳举办。商汤科技执行研发总监林倞出席峰会CV+专场,并发表题为“深度驱动的人工智能:从学术创新到产业落地”的演讲。林倞在演讲中表示,深度学习将带来将各项人工智能技术的突破,新一轮的科技革命蓄势待发,而商汤科技希望通过原创技术,用AI推动产业升级。
商汤科技执行研发总监林倞
同时,林倞进一步表示,技术研发应走出实验室,在产品落地的实践中发现问题、定义问题、解决问题,例如商汤科技两年前在业内率先推出的106点位原创技术,该技术能够让人脸面部轮廓及各个部位的定位更加精确。同时,商汤科技迅速将技术转化为产品解决方案,驱动了人脸识别在娱乐、拍照、商业等多场景中的大范围应用,进而推动该技术成为业内标准。另一方面,技术在行业的落地,能够带来大量的数据反哺,令算法突破与应用场景循环打通形成闭环,通过不断实践实现技术演进。
深度学习三大核心要素打造关键性技术创新
林倞介绍,商汤科技一直以来都在围绕算法研究、高性能计算和大数据三个深度学习的核心要素进行关键性技术创新,专注打造深度学习平台,进而构建人工智能、大数据分析行业解决方案。
在高性能算法层面,商汤科技提出高效、可拓展、灵活性的框架,覆盖从算法、硬件平台到软件框架的设计能力;同时商汤科技还建设大规模GPU计算集群,“我们的超算能力来自于超过 2600 块NVIDIA GPU的计算芯片,是国内新锐AI公司规模最大的。”林倞介绍道。
此外,商汤科技极为强调深度学习能力,为此自主研发的深度学习库PPL,在X86、ARM或者CUDA等不同的处理器架构上,相比第三方开源平台库都有较明显的优势。
大数据如今已经成为现代科技的基础设施,“我们在大数据方面有着深厚的积累,为技术创新提供了基础保障”,林倞表示,“判断一家企业是否为真正的人工智能企业,需要看其是否有专门的团队进行数据标注,而商汤科技在这方面拥有超过300人的全职数据结构化标注团队。”
基于以上高性能算法和深厚的大数据能力,商汤科技在新一代深度学习、人物关键点定位算法、文字检测与识别、视频标注与内容理解、几何与深度估计、强化学习与机器人等几个方面取得了算法研究的突破性进展。
林倞还特别提到,在人脸识别领域,标注点的数量是数据质量的一个关键指标。“一般来说,数据中的特征点越多,识别率越准确。”林倞表示,通过106人脸关键点,可以获取细微的面部结构信息,并在复杂的交互场景中供面部特效和美颜等功能调用,106点的识别准度到达99%,目前已被认为是行业标准方案。
人工智能产业化落地 促进成熟产业效率提升
经济学家曾指出,几十年来,依靠资源投入的数量型增长,受资本边际收益递减规律的作用,已现乏力;依靠技术投入的效率型增长,才是经济可持续发展的保障。未来中国经济的大发展必将依赖于科学技术与成熟产业叠加所带来的效率提升。
在技术与产业结合方面,林倞介绍,目前商汤科技人工智能各项技术的触角延伸至智慧安防、智慧金融、智慧商业、智慧家居、机器人以及无人驾驶、虚拟增强现实等领域,正在逐步加快推动学术与产业的结合。
在安防-智慧城市领域,商汤科技实现了在监控环境下对精细化的人车属性、层次结构、运动信息的分析并且进行结构化存储,让大量的视频数据和图像数据能够有效检索查询。林倞认为,安防行业也将对交通行业产生广泛深刻的影响,将会推动下一个变革。
以商汤科技的SenseFace系统为例,它能够通过预测跟踪可疑目标,实现“人脸天网”。商汤科技的SenseVideo,能够在视频监控以及辅助驾驶场景中,准确找出行人和车辆并分析其属性。
在金融领域,商汤科技主要针对金融行业实名认证的难点进行了布局,通过精确的算法,实现智能、自动化认证。以中国移动为例,接入商汤团队的人脸识别技术后,为数亿人提供了实名认证服务。
在移动互联网领域,通过人脸关键点定位、SLAM等技术的应用,商汤科技实现增强现实和3D增强现实、双摄拍照增强,提高了产品实用性及娱乐性。当前非常流行的Faceu应用,就是源于商汤自主研发的增强现实感引擎,实现了易用、精准的面部特效,并在发布后取得了AppStore免费榜第一名的好成绩。
身为商汤科技执行研发总监,林倞最希望看到的就是通过人工智能技术研发创新与产品落地,不断推动产业升级,为人们的生活与社会进步带来更多的价值,而这也是商汤科技一直以来努力的方向。业内人士认为,正是这样的理念,驱动着商汤科技在人工智能领域飞速驰骋,快速成长为机器视觉领域的标杆企业。