F5中国推出TBLB方案：以Token为核心，破解异构算力调度难题提效能-产业-智快网

在AI大模型推理从实验室走向大规模应用的关键阶段，如何高效调度异构算力资源成为行业焦点。应用交付与安全领域头部企业F5中国近日宣布，推出全球首个基于词元（Token）的负载均衡解决方案（TBLB），通过重新定义算力调度逻辑，为AI推理场景提供更精准的资源分配方案。该方案已在汽车、金融、通信等多个行业完成验证，实测显示可在不增加硬件投入的情况下，将GPU利用率提升最高60%，端到端响应速度提升近50%。

传统负载均衡技术诞生于互联网时代，主要依据连接数或请求数进行流量分配。但随着大模型推理进入高并发阶段，这种"平均分流"模式暴露出明显短板。F5中国区产品负责人指出，在AI场景中，单个请求的计算量可能相差百倍，真正消耗GPU资源的并非请求数量，而是Token规模、上下文长度及推理复杂度。特别是在中国特有的异构算力环境中，企业常混合部署NVIDIA、华为、阿里等不同厂商的GPU，传统方案难以准确感知底层算力状态，导致部分节点过载而其他节点闲置。

TBLB方案的核心突破在于构建了"算力感知"调度体系。该方案通过实时采集Token数量、GPU负载、KV Cache状态、任务队列长度等12项关键指标，运用动态权重算法调整请求分配策略。例如在汽车行业客户案例中，由6块A40与8块L20组成的混合算力集群，在部署TBLB后，Token生成速度提升30.3%，端到端响应时间缩短48%，且未产生任何额外硬件成本。通信运营商采用华为Ascend 910B的测试环境显示，并发用户数提升75%，Token处理效率近乎翻倍。

这种技术革新正推动行业基础设施逻辑发生根本转变。F5北亚区总裁黄彦文强调，AI竞争已从单纯的模型参数比拼，延伸至推理环节的资源调度效率。当前GPU迭代周期缩短至12-15个月，企业面临巨大的资产折旧压力，提升现有设备利用率成为关键。TBLB方案支持跨品牌、跨代际GPU的统一调度，经实测可将混合算力集群的整体利用率提升60%，有效延长硬件生命周期。

值得关注的是，这项源于中国实践的创新正在走向全球舞台。F5已成立专门的AI应用工程部，将TBLB的核心调度算法与全球客户场景深度融合。黄彦文透露，虽然创新发端于中国市场，但"Token中心化"的调度理念已获得国际认可，成为AI基础设施演进的重要方向。这种技术输出与本土创新的双向互动，印证了中国在AI工程化领域的领先地位。

在战略布局层面，F5中国将业务航道升级为"本地AI赋能"与"支持企业出海"双轮驱动。一方面围绕智能原生应用构建本地化能力中心，另一方面针对新能源汽车、高端制造等优势产业的全球化需求，提供覆盖多云环境的应用交付与安全解决方案。这种转变既体现了技术供应商的角色升级，也折射出中国AI产业从应用创新向基础技术输出的路径演进。

马斯克xAI推图转视频新模型：自然语言操控，轻松生成电影级720p视频

2026-06-05

WWDC 2026前瞻：库克或谢幕，iOS、macOS等系统与硬件亮点大揭秘

但这也算是苹果又一次做出了违背祖宗的决定了—— 早在2010 年苹果举行的 "Back to the Mac"特别活动上，乔布斯就公开表明MacBook绝不做触屏。至于其他的几个系统，像 iPadOS …

2026-06-05

{北京市发布“六个不得”要求护航中高考严

2026-06-05

中国移动香港2026年6月23日起网络调整 2G与3G业务将成历史

2026-06-05

2026年iPhone 16 Pro Max深度评测：性能影像续航全解析，是否值得买？

1️⃣ A18 Pro芯片：采用台积电3nm增强版工艺，CPU性能提升20%，GPU图形处理能力提升30%，即使是4K视频剪辑也能流畅运行iPhone 16 Pro Max的影像能力堪称专业级，三摄系统经…

2026-06-05

AMD高管谈英伟达RTX Spark入局AI PC：欢迎竞争，自信自家产品实力强劲

不过蒂库认为自家 Strix Halo 和后续 Gorgon Halo 足以与 RTX Spark 竞争，他还喊话开发者，称：“就目前而言……我的意思是，如果你不买 Strix Halo 笔记本电脑，那就…

2026-06-05

苹果“变招”：借谷歌云与英伟达芯片助力Siri查询处理

【环球网科技综合报道】6月4日消息，据科技媒体《The Information》最新报道，苹果将通过谷歌云，使用英伟达BlackwellB200数据中心芯片来处理部分Siri查询。此外，《The Inf…

2026-06-05

荣耀折叠屏市场表现亮眼！Q1份额翻倍至21% Magic V6成关键助力

荣耀折叠屏份额快速提升，与今年3月发布的高端折叠旗舰荣耀Magic V6密切相关。该机围绕轻薄、续航、屏幕可靠性和AI办公体验等核心场景进行升级，在高端折叠屏市场形成了更鲜明的差异化竞争力。据介绍，这块…

2026-06-05