谷歌发布第八代TPU：8t强训8i快推，为AI智能体发展筑牢算力根基-汽车-智快网

在近期举办的 Cloud Next '26 峰会上，谷歌正式推出第八代 TPU 架构，包含专为训练设计的 TPU 8t 和聚焦推理的 TPU 8i。这两款芯片将于 2026 年下半年面向市场开放，采用申请制分配，Google Cloud 用户需通过官网提交使用需求。目前原生 PyTorch 对 TPU 的支持处于预览阶段，谷歌正与特定合作伙伴及早期客户开展小规模测试，以优化算力资源分配策略。

TPU 8t 通过多项技术创新重塑模型训练格局。其搭载的 SparseCore 核心专为混合专家模型优化，可解决此类模型因参数不规则激活导致的内存访问瓶颈。结合谷歌自研的 Virgo 网络拓扑，芯片间通信带宽翻倍，外部数据中心连接带宽提升四倍。通过 Direct Storage 技术绕过 CPU 直接读取高速存储数据，训练速度提升达十倍。在算力集群方面，单个超级计算单元集成 9600 颗 TPU 8t 芯片，共享 2PB 内存，总算力达 121 ExaFlops，单位成本算力较前代提升 2.7 倍，能效比实现两倍增长。

针对实时推理场景，TPU 8i 通过硬件架构革新突破延迟限制。其配备的 288GB 高带宽内存和 384MB 片上 SRAM（容量为前代三倍），可将完整对话上下文缓存于芯片内部，减少外部数据交互。集体通信加速引擎（CAE）将芯片同步延迟降低五倍，互联带宽提升至 19.2 Tb/s。新型 Boardfly 网络拓扑借鉴 Dragonfly 架构思想，使千颗芯片系统中任意两点通信路径缩短 56%，从 16 跳减少至 7 跳。这些改进使推理任务性价比提升 80%，搭配谷歌自研 Arm Axion 架构 CPU 后，系统整体能效再获显著优化。

谷歌此次技术迭代精准回应了 AI 发展对芯片的差异化需求。训练场景需要极致算力与高效协同，推理场景则要求低延迟与高能效。第八代 TPU 通过架构分型实现专业分工，TPU 8t 构建的超级计算集群可支撑千亿参数模型训练，TPU 8i 的长上下文处理能力则推动 AI 从简单预测向复杂决策演进。随着这两款芯片向全球云客户开放，开发者无需掌握新编程语言即可调用算力资源，谷歌提供的开源参考模型代码将进一步降低技术门槛。这一布局或将重新定义智能体时代的算力基础设施标准。

华为携手尼日利亚MTN：全球首启Sub-1GHz Massive MIMO商用新篇章

尼日利亚是非洲人口最多的国家，这次合作直接把当地低频4G网络能力带上新台阶。华为通过材料、架构和算法的改进，解决了低频大天线体积大、重量重、没法商用的老问题，把全频Massive MIMO 的最后一块短板…

2026-04-23

vivo Y600 Pro即将发布：10200mAh超大电池+90W快充续航便携两不误

2026-04-23

小米18 Pro配置揭秘：2nm芯＋双2亿镜头＋7字头大电池背屏交互再升级

2026-04-23

苹果换帅华为涨价谷歌狂追AI：科技巨头“换挡期”如何改写未来？

一周之内，科技圈的“地震”密集到让人喘不过气：苹果官宣库克9月卸任，硬件掌门特努斯接棒万亿帝国；华为余承东直言“手机定价压力大，可能涨价”；谷歌紧急组建“突击小组”改进AI编程模型……这些看似独立的事件，实则…

2026-04-23

金标联盟携手vivo等厂商推进“公平运行内存机制” 助力安卓应用体验升级

通知称，随着应用功能日益强大，内存资源变得尤为宝贵。在多样化的终端设备上，内存占用过高是导致卡顿、发热、后台应用被杀乃至闪退的主要原因之一。为应对上述挑战，金标联盟牵头推进“公平运行内存机制”，旨在为开发…

2026-04-23

GPT Image 2来袭：图像生成大变革，设计师职业面临新挑战

【新智元导读】GPT Image 2的横空出世，直接暴打 Nano Banana 2，现在，真假难辨的照片和梗图已经满天飞了。现在，Image 2生成的游戏梗图，已经铺满了全网。其实早在一周前，关于Im…

2026-04-23

Rufus 4.14 Beta版来袭：Windows 11静默安装+预装应用批量移除超实用

快科技4月22日消息，Windows启动盘制作工具Rufus发布4.14Beta版本，带来多项重大更新，其中最受关注的两项新功能是Windows 11静默安装和预装应用批量移除。预装应用方面，Rufus …

2026-04-23

神州数码“养虾三件套”出招，破企业AI落地难题，开启智能新征程

2026-04-23