智快网
快讯 行业 产业 汽车 科技 AI+ 热点

14大主流AI!谁是最强者?实测GPT4、Claude-3、文心一言

2024-04-24来源:互联网编辑:汪淼

由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0中文理解、数学等多能力全球第一。

图片

评测显示,文心一言4.0表现优异,在中文推理、中文语言等评测上遥遥领先,和其他模型拉开明显差距。中文理解上,文心一言4.0领先优势明显,领先第二名GLM-4 0.41分,GPT-4系列模型表现较差,排在中下游,并且和第一名文心一言4.0分差超过1分。

在语义理解中的数学能力上,文心一言4.0与Claude-3并列全球第一; GPT-4系列模型位列第四五,其他模型得分在55分附近较为集中,明显落后第一梯队;而在语义理解中的阅读理解能力上,文心一言4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

在企业选择大模型最看重的安全性评测上,国内模型文心一言4.0表现亮眼,力压国际一流模型GPT-4系列模型和Claude-3拿下最高分(89.1分),Claude-3仅列第四。

花旗报告预测小米SU7亏损 小米方面称实际销售情况远超预期
【智快网】4月15日消息,近日,花旗汽车分析员发布了一份报告,对小米的造车业务进行了评估,其中提及小米SU7车型在2024年每售出一台平均将亏损6800元,全年整个造车业务预计将亏损41亿元。针对这一报告,小米方面迅

2024-04-15

专业视听科技打造文旅增长新引擎!4月17-19日,北京InfoComm China 2024盛会将启!
专业视听技术助力文旅打造非凡感官震撼随着人们对于非凡体验和视觉盛宴的追求不断攀升,可视、可听、可互动的专业视听技术为文旅/娱乐行业注入全新体验。例如:·尖端的投影技术能营造出引人入胜的立体影像,提供互

2024-04-10

自动驾驶“多地开花”业内呼吁立法支持
2024年政府工作报告中指出,要大力推进现代化产业体系建设,加快发展新质生产力。这是“新质生产力”首次被写入政府工作报告中,并被列为2024年十大工作任务的首位,是实现产业转型升级和高质量发展的关键力量。在积

2024-03-29

侨连五洲沪上进博,腾讯助力华侨华人连接中国市场
11月8日,由中国侨联主办、上海市侨联和上海市政府侨办承办的“侨连五洲 沪上进博”——2021华侨华人与中国市场高峰论坛在国家会展中心(上海)举行。中国侨联副主席程学源,上海市委常委、统战部部长郑钢淼,上海市副

2024-03-19