智快网
快讯 行业 产业 汽车 科技 AI+ 热点

谷歌发布第八代TPU:8t强训8i快推,为AI智能体发展筑牢算力根基

2026-04-23来源:快讯编辑:瑞雪

在近期举办的 Cloud Next '26 峰会上,谷歌正式推出第八代 TPU 架构,包含专为训练设计的 TPU 8t 和聚焦推理的 TPU 8i。这两款芯片将于 2026 年下半年面向市场开放,采用申请制分配,Google Cloud 用户需通过官网提交使用需求。目前原生 PyTorch 对 TPU 的支持处于预览阶段,谷歌正与特定合作伙伴及早期客户开展小规模测试,以优化算力资源分配策略。

TPU 8t 通过多项技术创新重塑模型训练格局。其搭载的 SparseCore 核心专为混合专家模型优化,可解决此类模型因参数不规则激活导致的内存访问瓶颈。结合谷歌自研的 Virgo 网络拓扑,芯片间通信带宽翻倍,外部数据中心连接带宽提升四倍。通过 Direct Storage 技术绕过 CPU 直接读取高速存储数据,训练速度提升达十倍。在算力集群方面,单个超级计算单元集成 9600 颗 TPU 8t 芯片,共享 2PB 内存,总算力达 121 ExaFlops,单位成本算力较前代提升 2.7 倍,能效比实现两倍增长。

针对实时推理场景,TPU 8i 通过硬件架构革新突破延迟限制。其配备的 288GB 高带宽内存和 384MB 片上 SRAM(容量为前代三倍),可将完整对话上下文缓存于芯片内部,减少外部数据交互。集体通信加速引擎(CAE)将芯片同步延迟降低五倍,互联带宽提升至 19.2 Tb/s。新型 Boardfly 网络拓扑借鉴 Dragonfly 架构思想,使千颗芯片系统中任意两点通信路径缩短 56%,从 16 跳减少至 7 跳。这些改进使推理任务性价比提升 80%,搭配谷歌自研 Arm Axion 架构 CPU 后,系统整体能效再获显著优化。

谷歌此次技术迭代精准回应了 AI 发展对芯片的差异化需求。训练场景需要极致算力与高效协同,推理场景则要求低延迟与高能效。第八代 TPU 通过架构分型实现专业分工,TPU 8t 构建的超级计算集群可支撑千亿参数模型训练,TPU 8i 的长上下文处理能力则推动 AI 从简单预测向复杂决策演进。随着这两款芯片向全球云客户开放,开发者无需掌握新编程语言即可调用算力资源,谷歌提供的开源参考模型代码将进一步降低技术门槛。这一布局或将重新定义智能体时代的算力基础设施标准。

华为携手尼日利亚MTN:全球首启Sub-1GHz Massive MIMO商用新篇章
尼日利亚是非洲人口最多的国家,这次合作直接把当地低频4G网络能力带上新台阶。华为通过材料、架构和算法的改进,解决了低频大天线体积大、重量重、没法商用的老问题,把全频Massive MIMO 的最后一块短板…

2026-04-23

苹果换帅华为涨价谷歌狂追AI:科技巨头“换挡期”如何改写未来?
一周之内,科技圈的“地震”密集到让人喘不过气:苹果官宣库克9月卸任,硬件掌门特努斯接棒万亿帝国;华为余承东直言“手机定价压力大,可能涨价”;谷歌紧急组建“突击小组”改进AI编程模型……这些看似独立的事件,实则…

2026-04-23

金标联盟携手vivo等厂商推进“公平运行内存机制” 助力安卓应用体验升级
通知称,随着应用功能日益强大,内存资源变得尤为宝贵。在多样化的终端设备上,内存占用过高是导致卡顿、发热、后台应用被杀乃至闪退的主要原因之一。 为应对上述挑战,金标联盟牵头推进“公平运行内存机制”,旨在为开发…

2026-04-23

GPT Image 2来袭:图像生成大变革,设计师职业面临新挑战
【新智元导读】GPT Image 2的横空出世,直接暴打 Nano Banana 2,现在,真假难辨的照片和梗图已经满天飞了。现在,Image 2生成的游戏梗图,已经铺满了全网。 其实早在一周前,关于Im…

2026-04-23

Rufus 4.14 Beta版来袭:Windows 11静默安装+预装应用批量移除超实用
快科技4月22日消息,Windows启动盘制作工具Rufus发布4.14Beta版本,带来多项重大更新,其中最受关注的两项新功能是Windows 11静默安装和预装应用批量移除。 预装应用方面,Rufus …

2026-04-23