字节跳动豆包团队近日推出了一款面向手机用户的AI助手软件——豆包手机助手技术预览版。这款产品基于豆包大模型的技术能力,通过与手机厂商在操作系统层面的深度合作,旨在为用户提供更加便捷的交互体验和丰富的功能服务。
豆包大模型在多个领域展现出卓越的性能,包括推理、视觉理解、图像创作、视频生成以及语音处理等,其图形界面操作能力更是在权威评测中屡获佳绩。凭借这些优势,豆包手机助手能够模拟人类操作手机,轻松完成复杂任务。团队明确表示,目前没有计划自研手机,而是选择与多家手机厂商展开生态合作,将助手功能整合到不同品牌的设备中,相关进展将陆续公布。
目前,开发者和科技爱好者已可通过豆包与中兴联合推出的工程样机nubia M153体验这一技术预览版。该设备已限量发售,售价为3495元。在演示视频中,豆包手机助手展示了其与手机深度融合后的核心能力,包括便捷的交互方式和强大的模型调用功能。
用户可以通过语音指令、侧边键或豆包Ola Friend耳机快速唤醒助手,实现无缝交互。无论处于哪个应用界面,用户均可直接针对屏幕内容提问,获取即时信息。语音通话、视频通话和屏幕共享等常用功能也被集成到助手中,用户只需双击侧边AI键即可调用。
在多模态交互方面,豆包手机助手与系统原生相册打通,支持用户通过语音直接对图片进行编辑,例如删除人物或清理杂物。这一功能进一步简化了操作流程,提升了用户体验。
豆包手机助手的AI操作手机功能尤为引人注目。该功能可根据用户指令在多个应用间自动切换,完成查票订票、商品下单、批量下载文件或查询物流进度等任务。例如,在跨平台比价场景中,用户只需说出需求,助手即可在多个电商平台搜索商品、对比价格并自动领券下单。涉及支付等敏感操作时,助手会提示用户手动确认,以确保安全。
为提升个性化服务,豆包手机助手引入了记忆功能,用户可根据需求开启或关闭,同时严格保护数据隐私。基于这一功能,助手还推出了操作手机Pro模式。该模式不仅调用GUI Agent模拟点击,还能直接调用系统工具,结合记忆数据和推理能力,更高效地处理复杂任务。例如,当用户要求推荐礼物时,助手可根据记忆中存储的收件人信息,直接筛选符合条件的选项。
尽管演示视频中的内容均为真实录制,但团队在视频结尾特别提醒,由于大模型技术仍存在不确定性,部分场景可能无法完全复现。当前产品的实际表现与预期尚有差距,未来将持续优化迭代。
行业分析指出,随着大模型技术的快速发展,手机AI助手领域正形成“手机厂商+大模型厂商”的合作模式。谷歌Gemini与三星的合作已为行业提供了跨界协同的参考案例,而豆包手机助手的推出或将进一步推动这一趋势的发展。





