智快网
快讯 行业 产业 汽车 科技 AI+ 热点

创新3D虚拟人多模态AI交互体验,Soul App亮相2024 GITEX GLOBAL

2024-10-15来源:智快科技编辑:芳华

通过理解自身的行为方式、记忆、偏好等内容,复刻一个专属于自己的虚拟化身,实现打破次元壁的互动,结识好友,获得陪伴......如今,科幻电影中描绘的场景正走向现实。

2024年10月14日-18日, GITEX GLOBAL海湾信息技术博览会在迪拜举办。在这个全球范围颇具影响力的科技盛会上,新型社交平台Soul App携最新自研的多模态大模型参展,该模型具备多模态理解、真实拟人、文字对话、语音通话、多语种等特性。在活动现场,观众可以通过数字装置,即时生成3D虚拟数字分身,通过实时动作捕捉与还原,体验自然、流畅、沉浸式的多模态互动。

Soul App CTO 陶明表示,“在受全球关注的科技大会上,我们期待与来自国内外的创新企业、科技公司共同交流,展现中国企业在社交领域的最新应用实践和数字娱乐的创新方案,共同探索社交发展的新可能。”

3D数字孪生,虚拟与现实的创新交互

GITEX GLOBAL至今已举办至第44届,自诞生以来,始终聚焦于以技术为驱动的创新,吸引了来自大型科技企业、全球政府、创新初创公司、专业投资者等的广泛关注和参与。目前,GITEX GLOBAL已发展成为中东地区规模最大、最成功的计算机通讯及消费性电子产品展,同时也是全球三大IT展之一。

自ChatGPT横空出世,标志着人工智能发展至新阶段,在世界进入全面拥抱人工智能的新时代的当下,今年,GITEX GLOBAL 2024规模再次升级,横跨两个大型场馆 —— 迪拜世界贸易中心和迪拜港,有全球超过6700家科技巨头和创新公司参展,展示AI领域最具突破性的科技发展、智能互联新发现、以及来自数字娱乐、社交、教育、健康等各大领域的应用落地标杆案例,汇聚最前沿的尖端技术思潮,引领行业变革的新风向。

作为国内较早将AI引入社交关系的互联网平台代表之一,Soul 携最新自研的多模态大模型参展GITEX GLOBAL 2024,展示AI技术积累以及在社交场景的最新落地实践。此次也是Soul首次亮相国际大型展会,大会上,现场观众可以重点体验到Soul集成3D虚拟人能力的多模态AI交互方案。

为了降低用户社交压力,Soul自2016年上线之初便不支持用户上传真实头像,年轻人通过平台提供的捏脸系统,自主创造个性化虚拟形象,在不强调颜值、地理位置等物理因素的情况下,自在表达,分享热爱,相遇同好。

2022年,Soul集成AI、渲染和图像处理等技术,推出自研的NAWA引擎,为用户创建个性化的3D社交形象和场景提供技术加持。基于该引擎,用户可以自主创作生动的虚拟形象,塑造网络世界的化身,并能灵活地配合声音、文字等各种信息,展现每个人鲜明的个性,精准传递情绪温度,在各种虚实融合的场景中与他人自在交流、互动,感受全新的社交体验。

集合过往的技术储备以及大模型研发进展的突破,现阶段,Soul 3D虚拟人能力全面升级,形成了成熟的集成3D虚拟人能力的多模态AI交互方案——即集合文字、语音、动作交互的多模态大模型方向,实现更接近人类模式的互动体验和更高效、自然、丰富维度的信息传递。

在大会现场,参与体验的用户可以实现高相似度的3D虚拟人的AI建模,通过包含人脸的90余个形状参数和6个属性参数,于几秒钟内,快速在3D世界精细化还原真实人脸的特征,打造专属的虚拟化身。

同时,基于实时的人体动作识别、数字还原以及多模态对话交互能力,现场可以实现3D虚拟人与真人的沉浸式互动。

多模态端到端大模型,超拟人的情感体验

事实上,包括语言、对话、3D虚拟人等维度在内,Soul聚焦于多模态大模型方向持续深耕。

在推出智能推荐引擎“灵犀”、以AI算法助力社交关系的发现沉淀环节后,2020年,Soul正式启动对AIGC的技术研发工作,系统推进在智能对话、语音技术、3D虚拟人等AIGC关键技术能力研发工作,并推动AI能力在社交场景的快速落地。

目前,Soul已先后上线了自研语言大模型Soul X,以及语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力。今年6月,Soul还在社交行业中较早推出了自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。

2024年,Soul AI大模型能力整体升级为了多模态端到端大模型,支持文字对话、语音通话、多语种、多模态理解、真实拟人等特性。

多模态端到端大模型的推出标志着Soul对人机交互体验的创新突破,同时,从文字、语音到视觉的模态升级,也意味着交互方式的颠覆式改变。

例如,Soul已基于自研AI能力推出了“数字分身”功能,用户可以直接授权平台基于聊天记录、发帖内容,或者以自定义方式,设置数字分身的形象和特征,在表征层(形象、声音、文字风格),身份层(社交关系、长期记忆、人设信息)和认知层(决策、观点、偏好),使数字分身达到最大程度复刻真人的效果。而“数字分身”不仅能实现更个性化、更千人千面的智能回复推荐,帮助用户进行社交破冰,还能在助力人设搭建和认知决策中,提升社交沟通效率。

接下来,通过最新集成的3D虚拟人能力和多模态端到端大模型的AI交互方案,Soul用户自主打造的3D虚拟人,可以作为数字世界的多模态全能助手,在平台群聊派对、瞬间广场等丰富社交场景中全面赋能用户的关系发现、建立、沉淀环节,拓展新关系的同时,提供高质量、趣味性、沉浸式的人机交互体验,反馈真实、自然的情感陪伴。

Soul App CTO陶明表示,“作为天然的流量聚集地和交互入口,社交被视为AI率先落地的最佳场景之一。我们将围绕用户的实际社交需求和具体社交场景,持续加大对AI技术的投入,给用户带来长期的可持续的价值。预计今年年底,Soul多模态端到端大模型将再次升级,推出全双工视频通话能力,让用户可以真正便捷、自然的体验到包括文字、语音、视觉在内的多模态创新交互。”

华为顶级旗舰价格大跳水,16GB+512GB直降2100元,为新机让路
这段时间虽然登场了很多新旗舰,但阿维觉得挺遗憾的,因为绝大多数新旗舰都只是常规升级,单纯为了启用第五代骁龙8至尊版和天玑9500,在这种情况下,甚至就连小米17 Pro系列上并不算多大创新的背屏也成为了大家津…

2025-11-15

高通跃龙IQ-X系列工业级PC处理器发布,为工业自动化注入AI新动力
高通跃龙 IQ-X 系列为工业自动化提供了 AI 基础设施,能够实现 AI模型移植,以及面向预测性维护、状态监测和缺陷检测等关键用例的应用开发。 该平台支持Qt、CODESYS等工业软件工具,通过高通AI软…

2025-11-14

华为PC业务双线并行:鸿蒙PC加速突破,智选PC延续Windows生态
11月13日消息,虽然有了鸿蒙PC,但华为似乎短期并不想放弃Windows系统。 有博主给出的消息显示,华为在PC业务上仍将维持“鸿蒙PC”与“智选PC”双线并行的策略,短期内不会放弃基于Windows系统的…

2025-11-13

荣耀500系列全渠道预约开启 2亿像素主摄+8000mAh大电池成亮点
影像方面,荣耀500系列可能全系标配2亿像素主摄,采用1/1.4英寸大底传感器,并引入雅顾影像调校技术。其中,Pro版或加入潜望式长焦镜头,支持高倍率光学变焦。 续航方面,荣耀500系列预计内置一块高达800…

2025-11-13

大疆新品亮点频现:Avata 360无人机配旋转云台,Osmo Action 6相机可变光圈
在镜头和视频规格方面,Action 6 将配备全新的 F2.0-F4.0 可变光圈镜头,等效焦距为 16mm;支持录制带有 HDR 和ProRes 编码的 8K / 30fps 视频,还支持 5.3K /…

2025-11-13

中国中煤突破!世界首台套600MW级超超临界锅炉实现煤气高效掺烧
IT之家 11 月 12 日消息,中国中煤官方今日宣布,其牵头成功研发世界首台套耦合副产煤气 600MW 级超超临界二次再热锅炉。该设备近日还成功入选国家能源局公告发布第五批能源领域首台(套)重大技术装备名单…

2025-11-12

华硕提前布局库存应对存储涨价,后续将灵活调整产品与售价策略
IT之家 11 月 12 日消息,华硕联席 CEO 胡书宾昨日在公司的 2025 年第三季法人说明会上表示,该企业已建立一定库存应对目前的DRAM 内存和 NAND 闪存涨价情况;华硕将调整产品组合,适度灵…

2025-11-12

2025年Q3中国平板市场:出货量增10.9%,华为连续八季领跑
11月10日,近日,国际数据公司(IDC)发布了2025年第三季度中国平板电脑市场季度跟踪报告。 数据显示,2025年第三季度中国平板电脑市场出货量为849万台,同比增长10.9%。其中,消费市场出货量同比增…

2025-11-12

摩托罗拉Edge 70 Ultra现身跑分平台,处理器型号成谜引猜测
IT之家 11 月 11 日消息,据科技媒体 NoteBook Check 今天报道,摩托罗拉上周刚刚推出 Edge 70 手机(对应国行版联想moto X70 Air),如今种种蛛丝马迹证明这家公司计划进…

2025-11-12