智快网
快讯 行业 产业 汽车 科技 AI+ 热点

OpenAI强化音频AI能力,无屏幕设备将至,欲重塑AI交互新形态

2026-01-02来源:快讯编辑:瑞雪

据行业内部消息,OpenAI正加速布局音频人工智能领域,计划推出一款以语音交互为核心的消费级硬件设备。这款设备将突破传统屏幕依赖模式,通过自然语音指令实现操作,旨在重新定义人机交互方式。知情人士透露,OpenAI已整合工程、产品与研究团队,集中攻克现有音频模型在准确性与响应速度上的短板,为硬件落地铺路。

当前,ChatGPT的语音功能与文本回答采用不同模型架构。OpenAI研究人员发现,现有音频模型在复杂场景下的表现仍显不足,例如应对打断、多轮对话等自然交互需求。为此,公司正在开发新一代音频模型,计划于2026年第一季度正式发布。该模型已具备生成更自然语音、实时响应打断的能力,甚至能模拟人类对话中的情感起伏。

在硬件设计理念上,OpenAI与谷歌、亚马逊等科技巨头形成共识:现有设备形态难以满足未来AI交互需求。公司团队认为,语音是人类最本能的交流方式,无屏幕设计不仅能降低使用门槛,还可避免用户过度依赖视觉界面。曾主导苹果产品设计的乔尼·艾维参与合作项目时强调,新一代设备应承担纠正消费电子负面影响的责任,通过“隐形交互”减少用户注意力分散。

尽管愿景宏大,OpenAI仍需跨越用户习惯与市场认知的双重障碍。内部数据显示,当前ChatGPT语音功能使用率偏低,既与模型性能不足有关,也源于用户对语音交互的认知局限。为改变这一现状,公司正通过产品迭代与用户教育同步推进,例如在现有平台中逐步强化语音功能体验。

组织架构方面,OpenAI已组建跨部门专项团队推进音频战略。来自Character.AI的语音专家昆丹·库马尔负责技术方向把控,工程师本·纽豪斯主导底层架构重构,多模态产品经理杰基·香农则协调跨模态交互设计。这种配置显示出公司对音频领域的重视程度不亚于其核心大模型研发。

产品规划显示,OpenAI的硬件布局不止于单一设备。公司正开发包括智能眼镜、无屏幕音箱在内的多形态产品线,定位为“环境感知型助手”。这类设备将通过音频、视频多模态输入,主动理解用户所处场景,在获得授权后提供适时服务。例如在烹饪时语音指导步骤,或在通勤时播报实时路况。

为支撑这一战略,OpenAI在2025年初完成一笔重大收购——以近65亿美元(约合人民币455.06亿元)价格收购乔尼·艾维联合创立的io公司。这笔交易不仅获得顶尖工业设计资源,更整合了供应链管理能力。目前,公司正同步推进模型优化、硬件原型开发与生产链路搭建,三条工作线并行以加速产品落地。

孟晚舟新年致辞:华为聚焦七大方向,以奋斗者精神开启新征程
华为要从“技术巨头”变身为“产业赋能者”,这条路并不好走:既要平衡好战略聚焦和行业需求分散的矛盾,也要解决生态建设和商业价值匹配的问题,还要应对同时外部的各种不确定性。 孟晚舟的这次新年致辞,很务实,本质也是…

2026-01-02

OpenAI加码音频AI研发 布局无屏设备或引领未来交互新潮流
OpenAI 团队希望用户通过“说话”而非“看屏幕”与设备互动,认为语音才是最贴近人类交流本能的方式。 与 OpenAI 合作推进硬件项目的乔尼・艾维也强调,无屏幕设计不仅更自然,还有助于避免用户沉迷。在推出…

2026-01-02

三星Galaxy Z TriFold:以创新实用之姿,解锁三折叠手机新体验
值得称道的是,和其他手机品牌三折叠屏幕不一样的是,三星Galaxy Z TriFold三折叠的外屏也可以单独使用,满足日常快速查看信息、回复消息的轻量化需求,无需每次都展开大屏,兼顾了便捷性与实用性。三星在…

2026-01-01

2000元档手机怎么选?三款续航强机评测,助你告别电量焦虑
其核心基础是10080mAh青海湖电池,这一电池方案在容量之外,更强调循环寿命与衰减控制能力,为长时间使用提供更稳定的电量表现。芯片采用天玑7300,在系统调校下,日常应用流畅度与功耗控制保持平衡,适合对性能…

2026-01-01

年度口碑佳作来袭,新年开启闪耀旅程,2026即刻奔赴!
具体以实际上线情况为准…

2026-01-01

手机长焦技术大比拼:小米华为OV各显神通,未来之路更精彩
而这也是我们用小米 17 Ultra 拍照时候的最直观体验:这颗变焦头,牺牲一点点 100mm 以上的光圈数,实际上是让 70-100mm中焦的影像能力更均衡了,日用更舒服。 远的不说,就拿「为一块传感器…

2026-01-01