智快网
快讯 行业 产业 汽车 科技 AI+ 热点

字节Seedance 2.0论文亮相:170人团队署名,吴永辉曾妍领衔,技术突破引关注

2026-04-17来源:天脉网编辑:瑞雪

字节跳动旗下AI视频生成技术Seedance 2.0近日在学术平台arXiv发布技术论文,同步公开26页详细评测报告及170人完整研发团队名单。这项被业界称为"现象级"的多模态视频生成技术,通过原生统一模型架构实现了文本、图像、视频、音频的跨模态理解与生成,在动作自然度、音画同步性、导演级分镜控制等维度达到行业领先水平。

技术突破直指传统生成式工具的核心痛点。过往模型依赖单一文本输入,在整合品牌素材、配音、历史片段时存在显著一致性缺陷,创作者需经历数十次试错才能获得可用成果。Seedance 2.0通过构建四模态统一理解框架,支持混合输入指令的实时解析,使人物运动轨迹更符合物理规律,多人交互场景不再出现逻辑错乱。其自研的音画对齐算法可精准匹配口型、脚步声、背景音乐与画面动态,在评测中实现98.7%的同步准确率。

该技术已通过Byteplus平台向全球100余个国家企业开放API调用服务,支持生成4-15秒、分辨率最高达720p的短视频内容。值得注意的是,服务覆盖范围特意排除了美国市场。企业用户可实现剧情脚本的自动分镜、运镜设计与节奏剪辑,还能对指定角色、动作或场景进行局部修改,或在现有视频基础上无缝续拍新内容。

在VBench等主流基准测试中,Seedance 2.0在质量、运动合理性、语义一致性等23项指标中全面领先同期竞品。论文披露的对比数据显示,其人物动作自然度评分超出第二名14.6个百分点,复杂场景生成效率提升3倍以上。研发团队特别强调,模型通过引入物理引擎约束模块,使奔跑、打斗等动态场景的失真率降低至2.3%。

团队构成显示剧烈人事变动:相较1.5 Pro版本,现有170人团队中有89人离职,同时引入62名新成员,核心研发层保持稳定。基础研究负责人吴永辉直接向CEO梁汝波汇报,预训练技术路线由位于帕洛阿尔托的曾妍团队主导。值得关注的是,抖音副总裁李亮近日否认了"亿元年薪挖角"传闻,但确认Seed团队采用"现金+字节期权+豆包期权"的复合薪酬体系,期权四年全部归属,业务发展良好时技术人员收益可能达数亿元级别。

华为Pura 90系列携手易烊千玺,以纯粹之姿共绘影像美学新画卷
从艺生涯里,易烊千玺始终没有被外界的流量与光环裹挟,而是沉下心来打磨演技,拒绝舒适区,不断挑战多元角色,在浮躁的行业环境中守住了内心的纯粹,一步一个脚印完成了自我突破,恰如他在ID 视频中所说的那样,那些想…

2026-04-17

索尼FCB-ER9100:高集成度设计赋能多领域 开启专业视觉应用新可能
索尼全新发布的4KP60超高清摄像机模组FCB-ER9100,搭载10倍光学变焦镜头,可轻松覆盖中短距离高清视觉需求;索尼(中国)官方授权经销商及高清视频二次开发方案商轩展科技指出:FCB-ER9100同时在…

2026-04-17

大疆Osmo Pocket 4云台相机登场!一英寸CMOS加持,2999元起售功能升级
Osmo Pocket 4 搭载全新 1 英寸 CMOS,结合 f/2.0 大光圈,动态范围提升至 14 级,支持 10-bit D-Log色彩模式,慢动作录制规格升级至 4K/240fps,同步新增支持…

2026-04-17

2026静音轻薄本怎么选?三款低噪高性能机型,满足办公创作多元需求
本文将推荐三款兼具低噪音与强性能的机型,其中荣耀MagicBook14 2026 酷睿版凭借92Wh超大电池、85W性能释放及创新的散热设计,成为追求静音办公与移动创作用户的首选。这款14英寸轻薄本搭载第三代…

2026-04-17

华为携手伙伴赋能交通运输:AI深度融合,共筑数智化升级新未来
立足AI技术深度融入交通运输全链条需求,华为推进技术创新与跨领域协同,树立“点—线—面—体”发展理念,从枢纽节点到路网通道,从客流服务到物流运营,华为携手行业伙伴,持续将领先的ICT技术与交通行业场景深度融…

2026-04-16

合成数据新框架:突破传统认知,解锁AI发展新场景与新挑战
【新智元导读】最新研究提出合成数据的全新分类框架,突破「生成模型=合成数据」的传统认知,涵盖反演、仿真与数据增强等方法,并按应用层次划分为数据中心AI、模型中心AI、可信AI和具身AI。 在这一框架下,最基…

2026-04-16