谷歌发布两款新一代TPU 分别专攻训练和推理

2026年04月23日阅读:56914

谷歌发布两款新一代TPU 分别专攻训练和推理
图片来源于网络，如有侵权，请联系删除

当地时间4月22日，在Google Cloud Next 2026大会上，谷歌正式发布其第八代TPU处理器的两款全新产品，分别是专为AI模型训练设计的TPU 8t与专为推理优化的TPU 8i。这两款芯片都将于今年晚些时候上市。

AI业内人士认为，这是谷歌史上首次将训练与推理任务拆分至独立芯片，标志着其AI硬体策略的重大转向。

谷歌做出这一战略调整的根本原因，是AI计算负载的日益分化。谷歌AI与基础设施高级副总裁兼首席技术官Amin Vahdat在官方博客中指出：“随着人工智能代理的兴起，我们认为，如果芯片能够根据训练和服务的需求进行个性化定制，那么整个社区将会受益。”

据谷歌介绍，TPU 8t针对AI模型训练进行了优化，可将“前沿模型开发周期从数月缩短至数周”。谷歌表示，TPU 8t的性价比比前代提升2.8倍，这对需要高性能芯片但又不希望承担高昂运行成本的客户来说至关重要。

TPU 8i则更适合推理任务（即运行AI模型）以及处理AI智能体，效能相较之前提升80%。

谷歌同时透露，TPU 8t、TPU 8i均运行在公司自研的Axion ARM CPU平台上，由公司第四代液冷技术支持。

从行业情况来看，以谷歌为首的超大规模云服务商（Hyperscalers）近年来正加码研发AI芯片，以挑战英伟达在该领域的统治地位。

作为先行者，2015年，谷歌开始使用其自主设计的处理器来运行人工智能模型，并于2018年开始将这些处理器出租给云客户。亚马逊则于2018年发布了用于处理人工智能请求的Inferentia芯片，并于2020年推出了用于训练人工智能模型的Trainium处理器。

英伟达在人工智能的训练和推理两个关键环节均提供全面的硬件与软件解决方案，其技术覆盖从数据中心到边缘设备的全平台部署。

在单颗AI芯片层面，除了被大量应用于训练的GPU系列产品；今年3月，英伟达公布了即将推出的新一代推理芯片，该芯片可让模型更快响应用户提问，这得益于其以200亿美元收购芯片初创公司Groq所获得的技术。

2025年12月24日，英伟达以200亿美元的价格对Groq开展了一次 “人才收购”，拿下了该公司大部分开发团队，并获得了其用于AI推理的LPU数据流引擎底层技术授权。