智快网
快讯 行业 产业 汽车 科技 AI+ 热点

阿里巴巴申请视频生成新专利:融合视听特征提升视频呈现效果

2026-03-06来源:天脉网编辑:瑞雪

阿里巴巴(中国)有限公司近期在专利领域有了新动作。企查查APP的信息显示,该公司申请公布了一项名为“视频生成方法、视频生成模型的训练方法及任务平台”的专利。

根据专利摘要内容,这项专利涉及一套完整的视频生成技术体系,涵盖视频生成方法、视频生成模型的训练方法以及任务平台。具体而言,在视频生成方法中,首先要获取参考图像和参考音频,其中参考图像需包含参考对象的视觉信息。接着,系统会分别针对参考图像中的视觉信息提取参考对象的视觉特征,同时对参考音频提取音频特征。随后,基于视觉特征与音频特征之间的交互特性,预测在音频特征影响下目标对象的参考动作信息,这里的目标对象是基于参考对象生成的。最后,依据参考动作信息和参考音频,生成目标对象对应的视频。

该专利技术的一大亮点在于,能够有效提升视频中目标对象的视觉信息与对应音频的匹配程度,进而显著改善视频的呈现效果。这一创新成果有望为视频生成领域带来新的技术突破和应用可能。

存储涨价潮来袭 雷军表态:小米多举措应对力保消费者体验稳定
对于小米的应对策略卢伟冰表示,小米产品覆盖手机、平板、电视、汽车等多品类,内存使用量和使用面非常大。对于消费者而言,这意味着在价格波动中仍能获得相对稳定的产品体验,也反映了中国科技企业在供应链管理与市场应对…

2026-03-06

高德地图携手华为鸿蒙:AR实景步导功能上线,导航体验再升级
IT之家查询华为官网获悉,华为鸿蒙 HarmonyOS SDK 的 AR Engine可提供运动跟踪、环境跟踪和命中检测等增强现实能力,适用于 AR 导航、AR 摆放、AR 测量等。 运动跟踪:持续跟踪…

2026-03-06

小米Xiaomi miclaw封测开启:手机AI从聊天迈向主动执行新纪元
小米在3月6日发布了国内首个手机端AI智能体Xiaomimiclaw,昵称为“手机版龙虾”,开启小范围封测,标志着AI助手从被动聊天向主动执行任务的系统级智能进化。 系统底层权限:以系统应用身份运行,可调用…

2026-03-06

iPhone17e性价比获赞 《三国:谋定天下》“降肝减氪”成SLG新选择
游戏里的"降肝"设计更是直击痛点:自动铺路功能让你告别手指抽筋的机械操作,主城内的资源土地减少了抢地纠纷,练兵所可以自动升级部队,就连攻城都能预约时间自动参与。抽卡系统也很良心,8%的橙卡概率比行业平均水平…

2026-03-06

三星Galaxy S26Ultra来袭:硬件防窥护隐私,AI生态联动开启智能新体验
更具巧思的是,S26Ultra 支持“通知防窥”功能,仅让顶部的弹窗通知区域进入防窥状态,在保护隐私的同时完全不影响主画面的视觉体验。通过硬件级隐私保护与成熟 AI 生态的双轮驱动,三星 Galaxy S2…

2026-03-06

OPPO 2025:三十而立,以AI为翼,用创新夯实用户体验根基
在2025年的OPPO开发者大会(ODC25)上,ColorOS 16的发布标志着OPPO在系统工程领域完成了一次“双螺旋”式的进化:一条链是AI从工具向直觉服务的跃迁,另一条链则是流畅度从单一指标向全场景物…

2026-03-06