从早期的游戏绘图架构公司起家的英伟达,在游戏绘图对图像精度和还原度要求日益提高的时代下,已经转为计算架构公司了,“架构”业务的内涵也随之加大了芯片研发的比重。
绘图架构虽然在近两年并未出现质变级提升,但日前的GTC 2018上还是发布了RTX(ray-tracing)实时光线追踪技术,在内容创作者或传媒业可大幅提高渲染速度和质量,还能创建最为逼真的3D可视化模型。虽然业务重点和大会的重头戏还是芯片和系统平台的发布,但可真实模拟现实场景、甚至达到电影大片图像效果的该技术势必成为图像处理的一次变革。
言归正传,回到计算架构的主题,此次英伟达发布的GPU、处理软件和系统平台众多,共同特点都是主打高性能、高速处理,并且突出与其他终端的互联,打造开放架构。
GPU可以比CPU更高效、更稳定完成海量数据处理任务,并行计算让传统的处理方式得到显著提升,高效处理所节省的时间和物力成本远远超过部署GPU所投入的成本,而且还能提供更优质的用户体验,不论是对服务供应商还是对直接用户来说都是一举两得。因此,在大会上,也抛出了“GPU用得越多,节省的成本也越多”的口号。
单独GPU性能不断提升之后,行业需求也日益复杂和多元,这是如果能串联多个GPU,形成更大的GPU集合、创造更高效的处理流程,这将会是未来GPU提升服务能力的关键。
为此,英伟达此次也推出了“NVSwitch”架构,在同时发布的DXG-2server中互联了16颗GPU,采用了全新的交换器结构后的互联设计在单一结构中实现了2PETAFLOP的最高效能。而且只需要2000W的功耗。高效能、低功耗意味着低成本,降低用户负担,为商业量产和推广助力,还可处理最大规模的数据集和最复杂的深度学习模型。
集群多个GPU使单一架构提升效能,而在万物互联、布局无人驾驶时代下,将其搭载到更多终端设备是下一步重点。
为此,英伟达此次重磅和ARM联合,宣布将共同打造IOT设备的AI芯片专用IP,这款机器学习IP集成到ARM的ProjectTrillium平台上,以实现机器学习,这项技术源于英伟达Xavier芯片以及去年开源的DLA深度学习加速器项目。
同时,基于自主机器系统级芯片 NVIDIA Xavier设计,同时推出了“NVDLA”免费开放式架构,旨在推广设计深度学习推理加速器的标准方法。据了解,NVDLA 的模块化架构具有可扩展性和高度可配置性,专门为简化集成和便携性而设计。
游戏、绘图行业的用户现在已不是最新架构和芯片的主要用户,毕竟开发成本摆在那里,只有顶级商家和极少数玩家才会对此买账。所以,必需要将人工智能能力深入到关卡设计、玩家角色定位、生态、产业每个环节,让人工智能模块与游戏应用和管理模块更好融合,为玩家提供浸入式亲临其境的体验,让广大普通玩家认可AI的效果和能力,最终才能让绘图芯片厂商和游戏开发商更多应用AI模块。
面对芯片行业AMD、微软等巨头的挑战,架构少有突破型升级的英伟达也在合作伙伴和自身生态圈上下足功夫,于是GTC 2018就推出了GEForce伙伴计划,让企业和游戏玩家之间更加透明,共同生长的同时也牢牢吸引了一众用户,也有媒体评论认为此举颇有建立行业垄断之嫌,在这里我们真诚希望的是更多架构能够服务于医疗、自动驾驶、金融科技等领域。
对此,也推出了DRIVEConstellation自动驾驶仿真系统,这是一款基于两种不同服务器的计算平台。第一台服务器运行 NVIDIA DRIVE Sim 软件,用以模拟自动驾驶汽车的传感器,如摄像头、激光雷达和雷达。
第二台服务器搭载了NVIDIADRIVE Pegasus AI 汽车计算平台,可运行完整的自动驾驶汽车软件堆栈,并能够处理模拟数据,这些模拟数据如同来自路面行驶汽车上的传感器。
计算架构驱动了芯片性能的多次升级,得以完成更高难度和级别的深度学习,不断优化模型。反过来,逐渐提高的人工智能能力也催生了芯片行业的更多市场需求,让高性能的GPU不断涌现,赋能更多场景,让人工智能产业更加繁荣。