该芯片的中心是Tensor Core,这是一款人造智能加速器,它将迎来下一阶段的AI应用。 然而,我们目前的AI算法并没有充分利用这个加速器,而且为了实现AI的另一个重大突破,我们需要改变我们的软件。
为了进入下一阶段,AI芯片还需要利用本地化。 地点在相同的数据上执行许多任务。 例如,如果您在杂货店,并希望获得购物清单上的所有商品,您可以尝试加快这一点,要求您的每个朋友在列表中获取一个商品。 这种方法是非常平行的,但也是效率低下,因为你可能会最终发送不同的朋友来接收彼此相邻的项目。 一个更好的方法是要求每个朋友去一个不同的过道,并获得那个过道中的所有物品。 来自本地的这种效率提升允许算法缩放内存墙。