智快网
快讯 行业 产业 汽车 科技 AI+ 热点

字节跳动发布豆包视觉理解、3D生成等新模型,加速多模态应用落地

2024-12-19来源:互联网编辑:芳华

继大语言模型价格以厘计算之后,视觉理解模型也宣告进入“厘时代”。

在12月18日举办的火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。

豆包大模型全面升级

研究显示,人类接受的信息超过80%来自视觉。视觉理解将极大地拓展大模型的能力边界,同时也会降低人们与大模型交互的门槛,为大模型解锁更丰富的应用场景。

据火山引擎总裁谭待介绍,豆包视觉理解模型不仅能精准识别视觉内容,还具备出色的理解和推理能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。此外,该模型有着细腻的视觉描述和创作能力。

图:火山引擎总裁谭待

此前,豆包视觉理解模型已经接入豆包App和PC端产品。豆包战略研究负责人周昊表示:“豆包一直在努力,让用户的输入更快更方便”。为此,豆包产品非常注重多模态的输入和打磨,包括语音、视觉等能力,这些模型都已通过火山引擎开放给企业客户。

会上,豆包3D生成模型也首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持 AIGC 创作的物理世界仿真模拟器。

豆包大模型多款产品也迎来重要更新:豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。

即梦Dreamina张楠认为,生成式AI技术可以把每个人脑子里的奇思妙想快速视觉化,“像做梦一样”。即梦希望成为“想象力世界”的相机,记录每个人的奇思妙想,帮助每个有想法的人轻松表达、自由创作。

图:即梦Dreamina 张楠

大会正式宣告,2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线,从而解锁多角色演绎、方言转换等新能力。谭待表示,豆包大模型虽然发布较晚,但一直在快速迭代进化,目前已成为国内最全面、技术最领先的大模型之一。

大模型应用加速落地

数据显示,截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍。大模型应用正在向各行各业加速渗透。

据悉,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。

与企业生产力相关的场景,豆包大模型也获得了众多企业客户青睐:最近3个月,豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长。

谭待认为,豆包大模型市场份额的爆发,得益于火山引擎“更强模型、更低成本、更易落地”的发展理念,让AI成为每一家企业都能用得起、用得好的普惠科技。

在公布豆包视觉理解模型超低定价的同时,火山引擎升级了火山方舟、扣子和 HiAgent 三款平台产品,帮助企业构建好自身的 AI 能力中心,高效开发 AI 应用。其中,火山方舟发布了大模型记忆方案,并推出 prefix cache 和 session cache API,降低延迟和成本。火山方舟还带来全域 AI 搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。

云原生是过去十年最重要的计算范式,大模型时代则推动着云计算的变革。火山引擎认为,下一个十年,计算范式应该从云原生进入到AI云原生的新时代。

基于AI云原生的理念,火山引擎推出了新一代计算、网络、存储和和安全产品。在计算层面,火山引擎GPU实例,通过vRDMA网络,支持大规模并行计算和P/D分离推理架构,显著提升训练和推理效率,降低成本;存储上,新推出的EIC弹性极速缓存,能够实现GPU直连,使大模型推理时延降低至1/50、成本降低20%;在安全层面,火山将推出PCC私密云服务,构建大模型的可信应用体系。基于PCC,企业能够实现用户数据在云上推理的端到端加密,而且性能很好,推理时延比明文模式的差异在5%以内。

谭待说:“今年是大模型高速发展的一年。当你看到一列高速行驶的列车,最重要的事就是确保自己要登上这趟列车。通过AI云原生和豆包大模型家族,火山引擎希望帮助企业做好AI创新,驶向更美好的未来。”

华为顶级旗舰价格大跳水,16GB+512GB直降2100元,为新机让路
这段时间虽然登场了很多新旗舰,但阿维觉得挺遗憾的,因为绝大多数新旗舰都只是常规升级,单纯为了启用第五代骁龙8至尊版和天玑9500,在这种情况下,甚至就连小米17 Pro系列上并不算多大创新的背屏也成为了大家津…

2025-11-15

高通跃龙IQ-X系列工业级PC处理器发布,为工业自动化注入AI新动力
高通跃龙 IQ-X 系列为工业自动化提供了 AI 基础设施,能够实现 AI模型移植,以及面向预测性维护、状态监测和缺陷检测等关键用例的应用开发。 该平台支持Qt、CODESYS等工业软件工具,通过高通AI软…

2025-11-14

华为PC业务双线并行:鸿蒙PC加速突破,智选PC延续Windows生态
11月13日消息,虽然有了鸿蒙PC,但华为似乎短期并不想放弃Windows系统。 有博主给出的消息显示,华为在PC业务上仍将维持“鸿蒙PC”与“智选PC”双线并行的策略,短期内不会放弃基于Windows系统的…

2025-11-13

荣耀500系列全渠道预约开启 2亿像素主摄+8000mAh大电池成亮点
影像方面,荣耀500系列可能全系标配2亿像素主摄,采用1/1.4英寸大底传感器,并引入雅顾影像调校技术。其中,Pro版或加入潜望式长焦镜头,支持高倍率光学变焦。 续航方面,荣耀500系列预计内置一块高达800…

2025-11-13

大疆新品亮点频现:Avata 360无人机配旋转云台,Osmo Action 6相机可变光圈
在镜头和视频规格方面,Action 6 将配备全新的 F2.0-F4.0 可变光圈镜头,等效焦距为 16mm;支持录制带有 HDR 和ProRes 编码的 8K / 30fps 视频,还支持 5.3K /…

2025-11-13

中国中煤突破!世界首台套600MW级超超临界锅炉实现煤气高效掺烧
IT之家 11 月 12 日消息,中国中煤官方今日宣布,其牵头成功研发世界首台套耦合副产煤气 600MW 级超超临界二次再热锅炉。该设备近日还成功入选国家能源局公告发布第五批能源领域首台(套)重大技术装备名单…

2025-11-12

华硕提前布局库存应对存储涨价,后续将灵活调整产品与售价策略
IT之家 11 月 12 日消息,华硕联席 CEO 胡书宾昨日在公司的 2025 年第三季法人说明会上表示,该企业已建立一定库存应对目前的DRAM 内存和 NAND 闪存涨价情况;华硕将调整产品组合,适度灵…

2025-11-12

2025年Q3中国平板市场:出货量增10.9%,华为连续八季领跑
11月10日,近日,国际数据公司(IDC)发布了2025年第三季度中国平板电脑市场季度跟踪报告。 数据显示,2025年第三季度中国平板电脑市场出货量为849万台,同比增长10.9%。其中,消费市场出货量同比增…

2025-11-12

摩托罗拉Edge 70 Ultra现身跑分平台,处理器型号成谜引猜测
IT之家 11 月 11 日消息,据科技媒体 NoteBook Check 今天报道,摩托罗拉上周刚刚推出 Edge 70 手机(对应国行版联想moto X70 Air),如今种种蛛丝马迹证明这家公司计划进…

2025-11-12