智快网
快讯 行业 产业 汽车 科技 AI+ 热点

蚂蚁开源Ming-Flash-Omni 2.0:全模态大模型多项能力领先,赋能多场景应用

2026-02-12来源:快讯编辑:瑞雪

蚂蚁集团近日宣布开源其最新研发的全模态大模型 Ming-Flash-Omni 2.0,该模型在视觉语言理解、语音可控生成及图像编辑等多个领域展现出卓越性能,部分指标甚至超越了国际顶尖的 Gemini 2.5 Pro,为开源社区树立了新的性能标杆。

作为业界首个全场景音频统一生成模型,Ming-Flash-Omni 2.0 突破了传统模型的局限,能够在同一条音轨中同时生成语音、环境音效与音乐,实现了音频生成领域的重大创新。用户只需通过自然语言指令,即可对音色、语速、语调、音量、情绪及方言等参数进行精细调控,满足多样化的音频创作需求。该模型在推理阶段达到了 3.1Hz 的极低帧率,支持分钟级长音频的实时高保真生成,在推理效率与成本控制方面均处于行业领先地位。

多模态大模型的发展趋势是走向更统一的架构,以实现不同模态与任务之间的深层协同。然而,现有的“全模态”模型往往难以兼顾通用性与专精性,在特定单项能力上,开源模型通常不及专用模型。蚂蚁集团在全模态领域深耕多年,Ming-Omni 系列模型在此背景下持续迭代升级。早期版本构建了统一的多模态能力基础,中期版本验证了规模增长对能力提升的作用,而最新发布的 2.0 版本则通过更大规模的数据与系统性训练优化,将全模态理解与生成能力提升至开源领先水平,并在部分领域超越了顶级专用模型。

Ming-Flash-Omni 2.0 的开源,意味着其核心能力将以“可复用底座”的形式向外界开放,为端到端多模态应用开发提供统一的能力入口。这一举措将显著降低开发者在多模型串联方面的复杂度与成本,推动全模态技术的广泛应用。

该模型基于 Ling-2.0 架构(MoE,100B-A6B)进行训练,围绕“看得更准、听得更细、生成更稳”三大目标进行了全面优化。在视觉方面,通过融合亿级细粒度数据与难例训练策略,模型显著提升了对近缘动植物、工艺细节及稀有文物等复杂对象的识别能力;在音频方面,实现了语音、音效、音乐的同轨生成,支持自然语言对音色、语速、情绪等参数的精细控制,并具备零样本音色克隆与定制能力;在图像方面,增强了复杂编辑的稳定性,支持光影调整、场景替换、人物姿态优化及一键修图等功能,即使在动态场景中也能保持画面连贯与细节真实。

百灵模型负责人周俊指出,全模态技术的核心在于通过统一架构实现多模态能力的深度融合与高效调用。开源后,开发者可以基于同一套框架复用视觉、语音与生成能力,从而大幅降低开发成本与复杂度。目前,Ming-Flash-Omni 2.0 的模型权重与推理代码已在 Hugging Face 等开源社区发布,用户也可通过蚂蚁百灵官方平台 Ling Studio 在线体验与调用该模型。

科大讯飞发布星火X2大模型 推理性能提升50% 星辰Agent平台智能体超130万
讯飞方面介绍,星火X2在实现通用能力全面升级的同时,更加专注于教育、医疗、汽车、智能体等高专业性、高体验性场景,致力于为这些领域提供领先、可靠的技术方案与支撑。当前智能体数量已经超过130万,作为企业级智能…

2026-02-12

科大讯飞推出星火X2大模型:全国产算力赋能,深耕多行业技术升级
新浪科技讯 2月11日下午消息,科大讯飞发布基于全国产算力训练的星火X2大模型。据悉,此次升级有两大亮点:一是通用能力全面升级,星火X2整体能力对标国际顶尖模型水平,在数学、推理、语言理解、智能体等能力上媲…

2026-02-12

金龙汽车2月11日微跌0.49%,近3日主力资金净流出超六千万,业绩增长引关注
(免责声明:分析内容来源于互联网,不构成投资建议,请投资者根据不同行情独立判断) 主营业务收入构成为:汽车及车身件94.59%,其他(补充)5.41%。金龙汽车所属申万行业为:汽车-商用车-商用载客车。202…

2026-02-12

科创人工智能ETF国泰(589110)2月11日微跌,今年份额规模双增超四成
2月11日,国泰上证科创板人工智能ETF(589110)收盘跌0.96%,成交额1029.92万元。 科创人工智能ETF国泰(589110)成立于2025年9月26日,基金全称为国泰上证科创板人工智能交易型…

2026-02-12

科创人工智能ETF华夏(589010)2月11日跌0.82%,年内份额规模双降
2月11日,华夏上证科创板人工智能ETF(589010)收盘跌0.82%,成交额8503.56万元。 科创人工智能ETF华夏(589010)成立于2025年3月26日,基金全称为华夏上证科创板人工智能交易型…

2026-02-12

从工程思维到工业能力:中国模型如何以务实路径领跑AI视频赛道
中国模型在 AI 视频上的阶段性领先,并不是在追求模型更聪明,而是更早把视频当成了一项工程问题去解决。 当Diffusion和Transformer 被正确分工、被组织进一条可复用的生产线,AI 视频就不…

2026-02-12

平价不减“果味”:苹果新MacBook或搅动入门笔电市场新格局
IT之家小编注意到,在多个海外媒体对苹果春季新品的报道中,都提到了一款全新的“平价版”MacBook:屏幕尺寸小于 13 英寸,采用iPhone 同款的 A 系列芯片,目标是与更便宜的 Windows 笔…

2026-02-11

三星Exynos 2700下半年量产在即:良率提升 性能比肩骁龙8E6
最新报告显示,Exynos 2700在Galaxy S27系列中的占比将提升至50%,这一变动将对高通的营收造成不小的压力。与此同时,三星已经开始着手推广其第二代2nm GAA节点SF2P,该节点预计将直…

2026-02-11

我国锂电池极寒测试获突破:零下34℃静置8小时容量超85%
据该团队低温电池技术负责人张盟副研究员介绍,为攻克传统锂电池在低温环境下的应用瓶颈,团队自主研发了超低温电池技术及配套人工智能电源管理系统。 更关键的是,该电池成功驱动工业级无人机完成了长续航飞行及多项任务…

2026-02-11