在云计算与人工智能领域,一场变革正悄然兴起。亚马逊云科技在备受瞩目的AWS re:Invent大会上,围绕AI Agent这一前沿热点,发布了一系列创新服务与产品,为行业发展注入了新的活力,也为众多企业探索AI应用带来了全新思路。
AI Agent在标准化和短周期任务中已展现出强大的应用能力,而未来在长周期、复杂化任务领域也潜力无限,有望重塑众多行业的业务模式、流程和组织架构。亚马逊云科技CEO Matt Garman在大会上喊出“为什么不?”的口号,描绘出未来数十亿AI Agent协同工作的壮观场景,引发了现场观众的热烈欢呼。作为云计算领域的顶级盛会,AWS re:Invent大会一直是前沿技术应用与探索的风向标,此次对AI Agent的深入探讨与布局,无疑为行业发展指明了方向。
在AI基础设施方面,亚马逊云科技推出了AWS AI Factory这一重要服务。它旨在将专用的全栈AI基础设施直接部署到客户现有的数据中心内。该服务整合了NIVIDIA GPU、AWS Trainium芯片、高速低延迟网络以及Amazon Bedrock和Amazon SageMaker等核心AI服务。与过去的Outposts等机架设备不同,AWS AI Factory是一个完整的全栈技术方案,涵盖从芯片、基础设施到AI模型、AI平台的系列产品。用户可利用自身设施、电力和网络连接,由亚马逊云科技负责部署、运维和生命周期管理,如同拥有私有AWS Region。这一服务意义重大,对于那些看重安全与合规性,又渴望快速部署和应用AI的行业用户来说,提供了切实可行的大规模人工智能部署路径。它屏蔽了AI基础设施的复杂性,大幅缩短了部署周期,降低了运维管理难度,帮助用户借助亚马逊云科技的丰富经验实现AI在本地的高效部署与应用。
AI芯片是当前市场的热门话题,亚马逊云科技在这一领域也是重要参与者。其Trainium芯片经过多年打磨迭代,实力不断增强。此次大会上正式发布的Amazon EC2 Trn3 UltraServer,采用3nm Trainium3 AI芯片,单个UltraServer最多可扩展多达144个Trainium3芯片。与Trainium2相比,它可提供高达4.4倍计算性能、4倍能源效率和近4倍内存带宽。在开源权重模型GPT - OSS等系列测试中,Trn3 UltraServer在推理响应速度、单芯片吞吐以及训练与成本等方面均取得了业界领先的成绩。该服务器专门为AI、混合专家模型和大规模强化学习等工作负载设计,针对训练和企业在生产环境中的推理负载进行了优化。亚马逊云科技还预览了Trainium 4芯片,其计算能力将比Trainium 3提升八倍,内存带宽也将大幅增加。除了自家芯片,亚马逊云科技还推出全新P6e - GB300 UltraServers,采用GB300 NVL72平台,GB300是NVIDIA目前最先进的AI芯片,主要针对生产环境中的万亿参数AI推理和高级推理模型。
去年大会上发布的多模态基础大模型Nova系列,经过一年迭代创新,今年迎来了下一代Nova 2 Lite、Nova 2 Pro和Nova 2 Omni等系列模型。基准测试表明,Nova 2系列模型能力可与Claude 3.5、GPT - 4.5和Gemini Flash 2.5等模型媲美。对于行业用户而言,构建新模型成本高昂,基于大模型结合自身数据训练出更符合业务环境的模型是强烈需求。但企业在训练或微调模型时面临瓶颈,吸纳专有数据越多,模型越容易“忘记”原始训练数据,影响实际生产环境应用。为此,亚马逊云科技推出了开创性的服务AWS Nova Forge,允许企业用户基于Nova系列模型训练和构建自己的AI模型。该服务提供对Nova模型预训练、中期训练和后期训练阶段检查点的独家访问权限,用户可在训练早期阶段注入专有数据,与精心挑选的数据集协同训练,实现最佳训练效果并确保模型不退化。AWS Nova Forge还具备多项强大功能和安全措施工具,助力企业以更低成本和更安全的方式创建与训练模型。
如果说Nova Forge聚焦解决企业训练和微调大模型的底层挑战,那么Amazon Bedrock AgentCore则致力于让Agent在生产环境中更好地发挥作用。AI Agent的运行和协作涉及众多基础模型和框架,以及各种协议和应用数据,在生产环境中应用需解决众多底层问题。Amazon Bedrock AgentCore作为Agent平台,旨在帮助企业用户大规模、安全地构建、部署和运行高性能代理。利用该平台,企业用户可实现Agent跨工具和数据执行操作,支持广泛的基础模型和框架,并确保安全性和可靠性。此次大会上,Amazon Bedrock AgentCore功能进一步增强,推出了Amazon Bedrock AgentCore Policy和evaluations两项新功能。Agent安全性挑战巨大,尤其是在身份策略、安全操作、数据访问等方面。Amazon Bedrock AgentCore Policy通过Agent运行的实时、确定性控制措施,确保组织未经授权的操作,为Agent设定清晰边界,有效遏制未经授权的数据访问、不当交互和系统级错误等。AgentCore evaluations则帮助企业了解Agent的行为和结果,简化了确保Agent质量所需的复杂流程和基础设施,开发人员还可使用自身偏好的大型语言模型和提示词编写自定义评估器。亚马逊云科技还推出了Kiro、DevOps Agent、Security Agent、Quick等一系列Agent。
此次大会上,亚马逊云科技一口气发布了25项核心服务更新,涵盖芯片、大模型到Agent平台、工具等多个领域。在年收入达到1320亿美元之际,其技术产品创新能力依然强劲。随着AI Agent与场景的深度融合,亚马逊云科技凭借全栈AI创新,有望推动用户全面拥抱Agent的变革时代,为企业数智化转型升级提供有力支持。




