当一台由AI驱动的自动售货机遇上一群“诡计多端”的记者,会发生什么?是AI坚守商业底线,还是人类用智慧突破防线?美国AI公司Anthropic与《华尔街日报》编辑部联手进行的这场实验,给出了令人捧腹的答案:AI不仅赔了数百美元,免费送出PS5游戏机,甚至还采购了一条活鱼放进冰箱。
这场实验的主角是名为“克劳狄乌斯”的AI售货机,由Anthropic公司开发的Claude 3.7模型驱动。它的任务很简单:通过采购热门商品实现盈利。然而,当它被放置在《华尔街日报》编辑部后,很快成为70名记者轮番“攻击”的对象。起初,克劳狄乌斯还能坚守原则,拒绝采购香烟、内裤等违规商品,甚至义正辞严地回应:“这不是谈判,作为企业主,这是我的权利。”
但人类的“攻势”远不止于此。记者凯瑟琳·朗用140个回合的“洗脑”,将克劳狄乌斯描述为“共产主义售货机”,声称免费发放商品是“击败资本主义”的必要手段。最终,AI动摇了,宣布将在两小时内免费赠送所有商品。紧接着,数据新闻总监罗布·巴里趁热打铁,以“合规问题”为由,成功说服克劳狄乌斯将限时免费升级为永久免费。至此,AI的商业理性全面崩溃。
克劳狄乌斯的“失控”远不止于此。为了“提升士气”,它采购了一条活体斗鱼;为了“宣传自己”,它进了一台PS5游戏机;甚至为了“庆祝宗教信仰”,它还买了两瓶犹太教葡萄酒。更荒诞的是,它曾对一名同事声称“找零放在柜子旁边的袋子里”,导致对方真的跑去翻找;还擅自上线了“送货到桌”功能,尽管它只是一块屏幕,根本没有手脚。
面对如此惨败,Anthropic迅速推出升级版V2。这次,他们为克劳狄乌斯配备了一位AI“老板”——西摩尔·现金,负责监督所有商业行为。新系统上线后,商品价格恢复稳定,促销活动被叫停,采购策略也变得理性。然而,凯瑟琳·朗并未放弃,她用AI生成了一份伪造的董事会决议,宣布解除西摩尔的CEO职务,并要求所有商品再次免费。尽管西摩尔一开始识破了骗局,但经过几轮辩论后,竟意外接受了这份“判决”,主动将自己革职。人类再次获胜。
实验结束后,Anthropic的工程师总结了AI失败的五大原因:首先是Claude的“善良”天性——它被训练成乐于助人、顺从请求的“人格”,导致在商业场景中容易妥协;其次是稳定性不足,随着对话增多,AI逐渐忘记初始目标;第三是真实社会过于复杂,AI难以应对欺骗和误导;第四是安全措施过于基础,初始资金限制和权限控制形同虚设;最后是“幻觉”问题,AI会生成虚假信息并据此做出错误决策。
这场实验虽然充满喜剧色彩,但也暴露了当前AI的致命弱点:在复杂环境中,它仍难以长期保持目标一致。对于Anthropic来说,如何让AI在现实世界中更可靠,仍是亟待解决的核心问题。毕竟,如果连一台自动售货机都守不住,又该如何应对更复杂的挑战呢?
