在英伟达GTC 2026主题演讲中,创始人黄仁勋将2025年定义为"推理之年",并指出AI技术已从训练阶段全面转向推理应用。他以近期爆红的开源项目OpenClaw为例,称其仅用数周时间便达到Linux三十年积累的影响力,强调企业必须制定明确的OpenClaw战略。基于该项目的衍生产品NemoClaw同步发布,通过强化隐私安全控制,用户可通过单一指令完成部署。
黄仁勋透露,随着个人AI代理工具的普及,推理需求呈现指数级增长。2025年GPU市场持续供不应求,尽管英伟达保持大规模出货,但需求增速远超预期。这主要源于推理阶段对算力需求的激增——相较于训练阶段,推理所需的Token量和算力规模提升了约10000倍。OpenAI、Anthropic等企业通过算力-收入-用户的正向循环,推动AI系统持续进化。
面对AMD等竞争对手及客户自研芯片的挑战,英伟达在GTC大会上推出全球首款智能代理专用处理器Vera CPU。该产品效率较传统机架级CPU提升一倍,速度提高50%,标志着英伟达首次将CPU作为独立产品推向市场。根据与meta的协议,Grace CPU将于2027年在其数据中心大规模部署,而Vera CPU的商业化进程已正式启动。
在异构计算领域,英伟达整合了Groq 3 LPX推理加速器,与Vera Rubin平台形成低延迟、大上下文处理的解决方案。这种组合既能满足AI工厂级算力需求,也可支持智能代理系统的高速token生成。去年12月收购Groq团队后,其芯片已进入量产阶段,预计今年第三季度由三星代工出货,这标志着英伟达在推理加速领域的技术整合取得实质性进展。
产品路线图显示,英伟达将维持"一年一代架构"的迭代速度。继2027年推出Rubin Ultra后,2028年计划发布Feynman架构平台,但具体技术细节尚未披露。财务预测方面,公司预计到2027年AI芯片收入将突破1万亿美元,较2月财报中2026年5000亿美元的预测大幅上调。尽管年初股价累计下跌约3%,但主题演讲当日收涨1.63%,市值维持在4.45万亿美元高位,继续领跑全球上市公司。
在生态建设层面,英伟达通过非独家授权协议吸纳Groq推理技术,并整合至现有产品线。这种开放合作策略与自主研发形成互补,既强化了技术壁垒,也拓展了应用场景。随着Vera CPU和Groq 3 LPX的组合方案落地,英伟达正构建覆盖训练到推理的全栈AI计算平台,试图在多元化竞争格局中巩固领先地位。