智快网
快讯 行业 产业 汽车 科技 AI+ 热点

百度文心5.0正式版上线:2.4万亿参数原生全模态,开启AI应用新征程

2026-01-23来源:天脉网编辑:瑞雪

百度近日正式推出并上线了其原生全模态大模型文心5.0,标志着人工智能领域在多模态理解与生成能力上迈出了重要一步。该模型拥有高达2.4万亿的参数规模,通过原生全模态统一建模技术,实现了对文本、图像、音频、视频等多种信息形式的全面支持,无论是输入还是输出都展现出强大的能力。

据介绍,文心5.0的技术路线与业界常见的“后期融合”方案截然不同。它采用统一的自回归架构,将多源数据如文本、图像、视频、音频等在同一模型框架内进行联合训练。这种设计使得多模态特征能够在统一架构下充分融合并协同优化,从而实现了原生的全模态统一理解与生成。该模型还采用了超大规模混合专家结构,激活参数比低于3%,在保持强大能力的同时,显著提升了推理效率。

在应用层面,文心5.0已经展现出其巨大的潜力。个人用户可以通过文心App和文心一言官网进行体验,而企业与开发者则可以利用百度千帆平台进行调用。在权威基准的综合评测中,文心5.0的语言与多模态理解能力已经超越了Gemini-2.5-Pro、GPT-5-High等国际知名模型,稳居国际第一梯队。其图像与视频生成能力也与垂直领域专精模型相当,整体处于全球领先水平。

百度应用模型研发部负责人贾磊在分享中强调,应用模型的价值在于其在实际场景中的应用效果。他介绍了百度基于文心基础大模型构建的矩阵模型和专精模型。矩阵模型面向产品级应用和通用场景,包括文心Lite模型、视频大模型和语音大模型;而专精模型则面向行业应用和垂直场景,如搜索闪电专精模型、电商蒸汽机模型等。

贾磊还分享了三项技术突破:基于声音Token的端到端合成大模型、5分钟超越真人的直播技术以及实时交互数字人技术。这些技术不仅提升了语音合成的自然度和表现力,还使得直播带货和数字人交互等场景更加生动和高效。例如,基于声音Token的端到端合成大模型通过离散表示定义token,以MoE大语言模型建模韵律,实现了高质量的语音合成。而5分钟超越真人的直播技术则通过少量采样和脸谱化妆技术,使合成语音具备直播带货所需的情绪、节奏与感染力。

在推动大模型落地产业方面,百度千帆平台发挥了重要作用。该平台产品负责人张婷介绍,千帆专为行业落地打造的Agent Infra提供了包括文心5.0及全场景150+SOAT模型服务在内的丰富资源。平台还集成了众多工具及MCP和Agent工具链,并结合数据管理和企业级服务,为企业提供全周期、稳定支持多场景业务的运行环境。目前,千帆平台上已累计开发超130万个Agents,以百度独家能力“百度AI搜索”为代表的工具日均调用量已突破千万次。

随着全球AI行业的快速发展,如何将AI技术应用于真实世界与行业,从而进一步产生价值,成为行业探索的重要方向。百度作为国内最早发布大模型的企业之一,正基于多年积累的技术实力,形成以芯片为底座、智能云为平台框架、以模型支撑各类智能体应用的“芯云模体”全栈自研生态闭环。这一生态闭环将持续探索赋能行业的AI解决方案,推动AI技术在更多领域的应用和发展。

华为Mate 80 Pro Max助力春晚:首次接入广播级系统参与全球竖屏直播
据了解,总台马年春晚首次将手机拍摄的舞台画面接入广播级系统,华为Mate 80系列将参与竖屏直播信号制作。据春晚竖屏导演柳刚介绍,本次接入广播级系统的具体机型为华为Mate 80 Pro Max。 柳刚表…

2026-02-16

宇树科技王兴兴谈具身智能:AI模型能力待提升,产业尚处爬坡期
【太平洋科技】2月15日消息,宇树科技CEO王兴兴接受央视财经采访时指出,当前具身智能领域面临的最大问题是AI模型本身能力不足,尤其是泛化能力和通用性不够。他以端到端训练为例:机器人在固定场景下成功率基本…

2026-02-16

2025手机数据库大盘点:续航、游戏、触控,谁能登顶年度之巅?
2025年我们光在游戏上测试就花费了上千小时,在新春之际,我们对过往测过的手机,特别是数据库5.0更新的手机做了复测汇总,这期视频你将直观的了解,在我们数据库的各个环节,谁最强!视频制作不易,记得收藏转发支…

2026-02-15

AI硬件新玩法来袭:手搓Claude Code拓麻歌子,硬件开发或迎新变革
它在观察 Claude Code 的每一个操作,确保这个 AI 助手真的在按照我们的意图工作。 目前,Claude Code拓麻歌子这个宠物项目,已经在 GitHub 上开源,我们也可以直接把这个电子宠物部…

2026-02-15