智快网
快讯 行业 产业 汽车 科技 AI+ 热点

阿里云发布通义千问2.5,全面赶超GPT-4 Turbo

2024-05-09来源:互联网编辑:芳华

本报讯(记者 张伟)通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为开源领域最强大模型。

历经一年多追赶,国产大模型终于进入核心竞技场,可与国外一流大模型一较高下。

奋力追赶一年,成就最强中文大模型

大模型技术爆发一年多,行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路,2023年4月问世以来,始终专注于基础模型的技术研发,从初代模型升级至2.5版本。相比此前的通义千问2.1版,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。根据权威基准OpenCompass的测评结果,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此佳绩。

同时,通义还发布了1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越meta的Llama-3-70B,在HuggingFace开源大模型排行榜Open LLM Leaderboard上进入榜首,再度证明通义开源系列业界最强的竞争力。

通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的榜首模型,也是国内用户规模第一的智能编码助手通义灵码的底座。

从曾经的追赶者到如今的并行者,通义大模型频频霸榜,可以说是国产大模型一年来砥砺前行、奋力追赶的缩影。

一年间,通义还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从APP、官网和小程序免费使用通义。大会当日,原通义千问APP宣布更名为“通义APP”,将通义大模型全套能力集于一身,致力于成为“通情达义”的全能AI助手。

坚定开源路线,成为中国最强开源大模型

去年8月,通义宣布加入开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺寸”开源路线陆续推出十多款模型。目前,通义开源模型下载量已经超过700万。

大模型的训练和迭代成本极高,绝大部分的AI开发者和中小企业都无法负担。meta、阿里云等推动的大模型开源风潮,让开发者不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大模型的应用落地进程。

为顺应不同场景用户需求,通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC等端侧设备部署;大尺寸模型如72B、110B能支持企业级和科研级的应用;中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外,通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。

通义72B、110B开源模型都曾登顶Open LLM Leaderboard榜首。在开放研究机构LMSYS Org推出的基准测试平台Chatbot Arena上,通义72B模型多次进入“盲测”结果全球Top 10,创造了国产大模型的先例。

长期沉淀的良好口碑为通义开源模型赢得一众铁粉,每有开源动作都会早早被开发者“蹲守”,也总能获得生态伙伴第一时间支持。“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。”阿里云CTO周靖人透露,未来通义大模型还会持续开源。

开源开放,打造最受中国企业欢迎的大模型

通义正在成为最受中国企业欢迎的大模型。根据最新数据,通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

5月9日,小米旗下的人工智能助手“小爱同学”与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态 AI 生成能力,并在小米汽车、手机等多类设备落地;微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。

此前,通义大模型还曾“上天入地”服务客户,中国科学院国家天文台人工智能组基于通义千问开发了新一代天文大模型“星语3.0”,这是大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义支持的新型矿山重大风险识别处置系统,成为大模型在矿山场景的首次规模化落地。

一直以来,阿里云都强调要成为“AI时代最开放的云”,通过开放的算力平台、开源的自研模型、优质的模型服务,帮助客户抓住大模型时代的机遇。如今,开源开放战略正为阿里云带来新的商业增长。

华为鸿蒙HarmonyOS 6发布:跨生态互联、安全升级、小艺智能体协同新体验
华为碰一碰支持应用超60个,用户可以通过简单的“碰一碰”轻松分享照片、音乐、链接等丰富内容。此外,还支持一碰多分享、游戏组队等互动体验,以及手机与电脑屏幕的轻碰分享,实现全场景设备间实现高效协同。 鸿蒙6…

2025-10-23

苹果2027年或跳过iPhone19直推20系列,设计革新纪念初代问世二十周年
报道还指出,苹果在2026年可能暂不推出标准版iPhone 18,而仅发布iPhone 18 Air、iPhone 18 Pro和iPhoneFold三款机型。 至于2027年,则以iPhone 20和平…

2025-10-23

苹果2027年新机命名或有变,或跳过“19”直接推出“iPhone 20”系列
【太平洋科技】10 月 23 日消息,据外媒报道,苹果预计在 2027年推出的iPhone新机将跳过“19”命名,直接将新机命名为“iPhone 20”系列。苹果或借此契机重新调整产品命名、机型定位和发…

2025-10-23

4999元起!努比亚Z80 Ultra:影像性能双巅峰的诚意之作
努比亚还把红魔的CUBE擎天游戏引擎直接下放到了这台影像旗舰上,可以根据不同游戏场景智能调度性能,既能保持满帧运行,又能控制功耗。 4999元起的价格放在现在的旗舰市场,不算便宜,但考虑到影像系统和红魔级游…

2025-10-23

舒福德S500睡眠智能体亮相,以数字生态革新开启全民睡眠健康新篇
作为麒盛科技旗下智能床品牌,自2005年自主研发智能电动床,开启探索智能睡眠体验:2017年推出全球首张智能床,初步实现睡眠数据的采集与分析;2022年作为北京冬奥会唯一智能床供应商,通过服务全球运动员,验证…

2025-10-22

一加15官宣两大充电黑科技 首发局间补电与旁路供电技术 性能再升级
IT之家 10 月 21 日消息,一加手机官方今日发文预热一加 15 新机,并透露为其带来了两个“黑科技”: 行业首发「局间补电」技术:局间休息10 分钟充会电,能多玩 1.23 小时 行业领先「旁路供电…

2025-10-22

华为发布全球顶尖AI人才招募令,余承东诚邀热爱AI的年轻人共攀高峰
昨日,华为招聘发布“全球顶尖AI人才招募令”。 据悉,此次招聘,面向对象为2026/1/1 -2026/12/31毕业的国内高校本科生与硕士研究生,2025/1/1 - 2026/12/31毕业的国内高校博…

2025-10-22

荣耀Magic8系列:以AI终端生态为钥,开启增长与估值新征程
早在2016年Magic一代首发时,便搭载了MagicLive智慧引擎,并首次提出“服务找人”的逻辑,虽无法与今日智能相比,却为智能生态协同埋下种子;2018年,荣耀推出YOYO智慧助手,突破了语音交互,开…

2025-10-21

电竞新旗舰iQOO 15登场:屏幕长焦SoC齐升级,定价略有上浮
这块6.85英寸三星2K直屏拥有144Hz高刷新率和8TLTPO技术,手动亮度峰值1000尼特,全局峰值亮度可达2600尼特,像素密度为508 PPI,还专门打造了硬件级游戏护眼。Q3的独赋能下,iQOO…

2025-10-21