这是继前天推出首款自研Arm架构云服务器CPU Graviton后,亚马逊云(AWS)的又一大动作。
Inferentia是一款低成本、高性能、低延迟的机器学习推理(inference)芯片,由亚马逊云团队设计打造。这款AI芯片将在2019年下半年推出。
主打AI推理:低成本、高性能、低延迟
亚马逊云没有进一步透露该芯片的其他参数,不过根据亚马逊云CEO Andy Jassy在演讲中表示,每个Inferentia芯片的计算力将会高达“几百TOPS”,多块芯片组合在一起后的计算力将会高达“数千TOPS”。
目前已公布的最强算力AI芯片为华为最新发布的7nm昇腾910芯片半精度(FP16)运算能力为256TFLOPS,整数精度(INT8)512TOPS。
图为 亚马逊云CEO Andy Jassy
Inferentia支持FP16、INT8精度,同时支持TensorFlow、Caffe2、ONNX等流行机器学习框架。
用户可以通过亚马逊云的SageMaker、EC2和同样是新推出的Elastic Inference云服务享受到这块芯片提供的AI计算力。
除了Inferentia之外,亚马逊云今天还发布了一系列云计算新品,比如Elastic Inference加速平台,它能够在所有亚马逊EC2服务上提供GPU加速计算,让AI推理过程速度更快、成本更低(最高能节省75%)。
此外,亚马逊云还推出了区块链管理服务,用于管理点对点支付、处理贷款并帮助企业与分销商和供应商进行交易,支持超级账本平台(Hyperledger Fabric)与以太坊。
AI能帮亚马逊云坐稳第一宝座吗?
继谷歌和华为之后,亚马逊是世界上第三个正式推出云端AI芯片的云服务企业。
根据亚马逊最新财报显示,第三季度亚马逊的云业务(AWS)营收高达66.8亿美元,同比增长46%,持续占据云计算市场的第一地位。
不过,虽然亚马逊云几乎从“出生”开始就保持着第一的位置,但亚马逊云在2017年的市场份额高达54.1%,在微软、谷歌等企业的一路穷追猛打之下,亚马逊云在今年第三季度的市场份额已经下滑到了32%。(Canalys数据)
此外,2018年第三季度全球云基础设施服务支出总额达到210亿美元,微软云Azrue市场份额额占17%,位居第二;谷歌云与阿里云分别以7%和4%的比率位列全球第三、第四名。
亚马逊云的第一地位在近年来越来越不稳固,在微软、谷歌来势汹汹的当下,亚马逊云本场re:Invent大会可谓是开足了马力,抛出了从云服务、到AI、再到区块链的一系列新品。
目前谷歌已经推出了三代专用AI云计算芯片TPU、华为推出了昇腾系列AI芯片、阿里成立了专用芯片公司、微软的FPGA系列云端AI芯片也在业内小有名气,在诸多云服务厂商加码发力人工智能的当下,全球老大亚马逊云自然也不甘落后。
不过我们还要等到明年下半年才能看到亚马逊云的这款AI芯片Inferentia正式面世了。
今年2月已被曝芯片打造计划
早在今年2月,亚马逊开始设计定制AI芯片的消息已经基本坐实。在智东西今年2月的报道中提到,拥有449名有芯片专业知识、技能的员工,这要归功于这个亚马逊在过去几年中的招聘和收购。
当时,亚马逊还在为其网络服务部门(AWS)招聘芯片工程师,可能为AWS数据中心的服务器设计AI芯片。
其中最为值得一提的自然是亚马逊在2015年以3.5亿美元收购以色列芯片制造商安纳普尔那实验室(Annapurna Labs)。
在前天亚马逊云宣布首款自研Arm架构云服务器CPU Graviton后,亚马逊就曾表示这款CPU的技术源自与Annapurna Labs团队。在Graviton之前,亚马逊还曾与他们合作打造过两代ASIC芯片。
此外,已倒闭的芯片创业公司Tabula也是亚马逊云的芯片技术来源之一。Tabula成立于2003年,致力于新型设计的称为现场可编程门阵列(或FPGA)的芯片,该芯片可以在运行中重新编程,该公司在2015年倒闭。据LinkedIn信息,AWS已聘请至少九位来自Tabula的前工程师。
结语:云服务厂商推出AI芯片已成潮流
亚马逊云的第一地位在近年来越来越不稳固,在微软、谷歌来势汹汹的当下,亚马逊云的Inferentia AI芯片能否扳回一局,重新抢占回那些失去的市场份额,如今还是个未知数。
不过,全球各大云服务厂商争相推出专用AI芯片的潮流已经非常明显,云服务中心这块巨大无比(并且还在不断迅猛增长)的大蛋糕,已经被无数人给盯上了。
相关推荐
8月上旬,深鉴科技CEO姚颂出现在北京一场以科技创新趋势为主题的小规模交流会中。 姚颂今年25岁,是国内人工智能芯片领域冉冉升起的新星。两年半前,他与在清华的导师、学长共同创立深鉴科技,专注于深度学习加速解决方案的研发。创立后在A轮融资中得到了赛灵思、蚂蚁金服、联发科等知名产业资本的投资。 就在20多天前,深鉴科技突然宣布被芯片