智快网
快讯 行业 产业 汽车 科技 AI+ 热点

Meta推出Llama API,携手Cerebras和Groq打造超高速AI推理方案

2025-04-30来源:ITBEAR编辑:瑞雪

在科技界的瞩目下,meta公司在首届LlamaCon大会上不仅推出了独立的AI应用,还解锁了一项重要资源——Llama API,目前正以免费预览模式面向全球开发者开放。

据悉,Llama API为开发者提供了测试最新模型的机会,包括备受期待的Llama 4 Scout和Llama 4 Maverick。为了简化开发流程,meta公司特别设计了一键API密钥创建功能,并配备了轻量级的Type和Python SDK。这些举措使得开发者能够迅速上手,无需繁琐的配置。

更为贴心的是,Llama API完全兼容OpenAI SDK,为那些计划从OpenAI平台迁移应用的开发者提供了极大的便利。这意味着他们可以在不改变原有开发习惯的前提下,轻松切换至Llama API,享受meta带来的技术红利。

为了进一步提升Llama API的性能,meta携手Cerebras和Groq两大技术巨头展开合作。Cerebras宣称,其Llama 4 Cerebras模型的tokens生成速度高达2600 tokens/s,这一速度远超传统GPU解决方案,如NVIDIA,达到了18倍的领先优势。

根据Artificial Analysis的基准测试数据,Cerebras的这一速度不仅超过了ChatGPT的130 tokens/s,更是DeepSeek的25 tokens/s的数十倍之多。Cerebras的CEO兼联合创始人Andrew Feldman对此表示:“我们非常自豪能够让Llama API成为全球最快的推理API。在构建实时应用时,开发者对速度有着极高的要求,Cerebras的加入使得AI系统的性能达到了GPU云无法比拟的高度。”

而Groq提供的Llama 4 Scout模型虽然速度略逊于Cerebras,但也达到了460 tokens/s,相比其他GPU方案快了4倍。在费用方面,Groq上的Llama 4 Scout每百万tokens输入费用为0.11美元,每百万tokens输出费用为0.34美元;而Llama 4 Maverick的对应费用则分别为0.50美元和0.77美元。这些数据显示出Groq在提供高性能的同时,也保持了较低的成本。

此次meta推出的Llama API及其与Cerebras和Groq的合作,无疑为AI领域注入了新的活力。随着技术的不断进步和成本的进一步降低,AI应用将更加广泛地渗透到各个领域,为人类社会的发展带来前所未有的变革。

荣耀500 Pro规格揭晓:骁龙8 Elite加持 2亿主摄配8000mAh大电池
IT之家 11 月 14 日消息,博主 @数码闲聊站 今日曝光了荣耀 500 Pro 手机的核心规格,这款新机将于近期上市。 IT之家整理如下:6.55 英寸 2736*1264p 120Hz 中屏 骁龙…

2025-11-15

苹果联名iPhone Pocket:争议中售罄,高价能否续写品牌忠诚传奇?
苹果与日本时尚品牌三宅一生日前联名推出的iPhone Pocket(iPhone 口袋)11月14日正式开售,1299元至1899元的定价引发全网热议,成为科技圈与时尚圈跨界合作的又一争议焦点。尽管争议不断,…

2025-11-14

iPhone 17系列上市两月中国市场激活破千万,配置亮眼预售火爆
2025年11月14日,知名数码博主“数码闲聊站”爆料称,iPhone 17系列于本周完成中国市场激活超1000万台。 据了解,iPhone 17系列于2025年9月10日苹果秋季发布会推出,含标准版、Air…

2025-11-14

Apple Store应用6.6版焕新登场:液态玻璃设计带来视觉与交互新体验
2025-11-14 08:20:29 作者:狼叫兽 今日,iPhone与iPad平台的AppleStore应用迎来6.6版本更新,此次更新引入了全新设计的应用图标,并对界面进行了视觉升级,以适配iOS 2…

2025-11-14

中国“天衍-287”超导量子计算机搭建完成 搭载同款芯片将全球开放应用
感谢IT之家网友 的线索投递! 11 月 14 日消息,据《科创板日报》11 月 13日报道,从中国电信量子研究院获悉,搭载“祖冲之三号”同款芯片的超导量子计算机“天衍-287”已完成搭建。 该量子计算系…

2025-11-14

iPhone17系列销售势头猛 本周国内激活量或冲破1000万台大关
【CNMO科技消息】11月14日,据数码博主爆料称,iPhone17系列国内激活量将于本周突破1000万台。截至11月2日,该系列在国内的激活数量已突破825万台,其中iPhone 17 Pro Max约3…

2025-11-14

华为Mate 80系列新料:20GB国产内存搭配麒麟9030 配置亮点多
根据近期华为新机规划以及各方爆料,这款机型预计为华为 Mate 80 系列,有爆料称该系列新品将在 11 月 25 日发布。其中,ProMax 并非简单的名称更换,而是定位与 Pro 版差距更大的新增机型…

2025-11-14

vivo S50系列12月将至:S50 Pro mini紧凑旗舰,S50配望远镜后摄
vivo S50系列,包括 vivo S50和S50 Pro mini 。预计将在12月发布。 vivo S50 Pro mini将是一款紧凑型旗舰手机,配备 6.31 英寸显示屏。 据传闻 它将配备高通骁…

2025-11-13

京东11.11平板教育品类齐发力 办公游戏平板热销 智能学习设备受青睐
直播渠道同样表现抢眼,联想小新Pro GT、荣誉平板GT2 Pro、小米平板7 Pro获得观众最多青睐。在新兴的闺蜜机品类中,海信、小度添添、小米占据品牌领先地位,海信大白闺蜜机X8 Pro、小度添添闺蜜机…

2025-11-13