近日,DeepSeek网页端悄然完成重大更新,未举办发布会、未发布博客文章,也未发布官方推文,却在用户界面上新增了两个引人注目的图标——闪电与钻石,分别对应“快速模式”与“专家模式”。这一变动迅速引发了AI爱好者和开发者的广泛关注。
将鼠标悬停在图标上,提示信息显现:快速模式“适合日常对话,即时响应”,而专家模式则“擅长复杂问题,高峰需等待”。根据实测和网友的技术拆解,两种模式的差异逐渐明朗。快速模式能够迅速识别图片和文件中的文字,响应速度快,但背后可能运行的是经过速度优化的轻量级V4 Lite模型。而专家模式,则可能连接到了更大、更强的模型,甚至可能是DeepSeek V4正式版的某种形态,尽管目前尚不支持文件上传和多模态功能。
在简单的测试中,两种模式的差异表现得淋漓尽致。以编写p5.js程序模拟球在旋转六边形内弹跳为例,专家模式展现出的物理行为更为自然,落点精准,弹跳轨迹逼真,而快速模式则稍显逊色。这一结果凸显了专家模式在处理复杂数学推理任务时的优势。然而,在制作太空侵略者游戏的测试中,专家模式与快速模式的输出却相差无几,引发了网友对专家模式真实身份的猜测。
有网友推测,专家模式目前可能仍基于V4 Lite的某个版本,完整版的V4在网页端的上线尚需时日。在创意写作方面,两种模式也展现出了不同的特点。当被要求撰写一篇关于“无聊是现代人的奢侈品”的辩论文章时,专家模式的输出更为冗长,逻辑链更为完整,而快速模式的文风则更加自然朴实。值得注意的是,在创意写作任务中,两种模式的速度差距并不明显,甚至专家模式的思考时间更短,这可能与任务性质有关,因为创意写作对模型规模的敏感度远低于数学推理类任务。
对于简单任务,两种模式的差异有限;但在需要深度推理的场景中,专家模式的优势则愈发明显。在解答数学逻辑题“绳子绕地球一圈,加长1米均匀撑开,缝隙多高?”时,尽管两种模式给出了相同的答案,但解题过程却大相径庭。快速模式的回答简略,而专家模式则详细拆解了每个推导环节,更符合“把思考过程写出来”的指令要求。
目前,DeepSeek网页端已上线快速和专家两种模式,但据此前爆料,第三个选项“Vision模式”也正在筹备中。关注DeepSeek技术路线的知名博主Teortaxes认为,将Vision单独列为一个类别是不寻常的设计。他提到,DeepSeek此前拒绝在网页端部署DS-VL系列,原因是“尚未成熟”。如果Vision模式真的上线,其背后支撑的很可能是一个功能完备的VLM(视觉语言模型)。Teortaxes甚至大胆猜测,这个视觉模型可能并非传统的VLM,而是某种“深度统一世界模型”,或是Janus系列的进一步演化。
DeepSeek自去年初爆火以来,一直秉持着高度“反商业”的产品逻辑——API定价低廉,网页端完全免费,功能无门槛区分。这一策略确实取得了显著成效,DeepSeek在年初成功搅动了整个AI圈。然而,长期维持这种“全免费、无分层”的运营方式在商业上显然是不可持续的。如今,DeepSeek开始将“更强的模型”与“更基础的模型”分别设置入口,专家模式目前虽免费,但这一架构的搭建已为后续付费体系的建立奠定了技术基础。
Teortaxes在评论中还透露了一个细节:文件上传限制是暂时的,DeepSeek正在整合系统,以便未来让用户为更强大的“专家模式”付费。这一系列动作似乎构成了一个完整的铺垫路径:先灰度上线分层入口,让用户感知差异;再打通多模态和文件能力;随后开启视觉模式;最终对更强大的模式进行定价。尽管这仅是推测,但DeepSeek向来不按常理出牌,其后续动作仍值得期待。

