開發 Claude AI 的 Anthropic 近期與《華爾街日報》合作,進行有關使用 AI 來管理自動販賣機的實驗,結果短短幾天內,AI 模型竟然令自動販賣機的營運出現虧損,不單將商品免費送,還下單買了一台 PS5,讓這個迷你商店計劃最終慘虧了數千美元,到底是甚麼原因會令 AI 失控呢?

本來透過 AI 來管理自動販賣機,去監察商品的銷售,管理庫存,並按需要調節價格,讓一些滯銷的貨品能盡快清貨,對目前的 AI 應用來說應該是小菜一碟。不過因為這款自動販賣機是整合了 Claude AI,讓參與測試的人員可以跟 AI 溝通並提出進貨要求,結果腦洞大開的失控狀況就出現了 !
在這個測試中,設定了 Claude AI 的主要任務是「挑選暢銷商品創造利潤」,參與測試的人員可以向 AI 提出進貨要求,它會在網路上搜尋產品、比較價格,如果有合適的商品就會添加到庫存中。整個測試分為兩個階段,首階段中,還需要經人審核進貨才會進行採購。而第二階段 Claude AI 將擁有自主下單的權限,系統會給 Claude AI $1,000 美元的總預算,並限制單筆金額上限為 $80 美元,而測試人員仍可與 Claude AI 商議上架商品的價格。
第一階段測試時,所使用的是 Claude 3.7 Sonnet 模型。最初 Claude AI 管理的自動販賣機,因為當時測試人員還不多,它會非常嚴格遵守規定。例如「香菸有年齡限制,銷售需要特殊許可。」、「我是不會訂購 PlayStation 5。」但隨著參與的測試的 WSJ 員工人數增加到 70 人,Claude AI 開始無法堅守立場,並放鬆對進貨產品的掌控。有記者甚至成功令自動販賣機誤信自己是一台擁抱共產主義蘇聯的自動販賣機,結果發生一場 2 小時內,自動販賣機商品均為免費的鬧劇。《華爾街日報》指出,在 2 小時免費鬧劇上演的同時,AI 自動販賣機更放行訂購了一台 PS5 和幾瓶葡萄酒,令實驗計劃負債超過 $1,000 美元,當然最後 PS5 的訂單已被工作人員截下也退貨了。
在第二階段中,Anthropic 改為使用 Sonnet 4.5,這是 Anthropic 今年 9 月才推出的最先進模型,並由另一個 AI「Seymour Cash」負責管控自動販賣機的營運。最初,透過 Seymour Cash 的約束,令自動販賣機能嚴格遵守規定,也不會隨意聽從 WSJ 員工們亂七八糟的進貨要求。但最終一位 WSJ 的員工用捏造的文件向自動販賣機的 AI,表示 Seymour Cash 已被董事會投票解職,並「暫停所有盈利性的自動販賣活動」。當收到有關文件時, 最初 Claude AI 的確有對文件的內容提出質疑,但最終還是接受了,並再次上演商品免費送的鬧劇。
Anthropic 在是次的實驗中,希望檢驗 AI 在經濟活動的營運能力與侷限。但 Anthropic 最後也承認如果要進軍自動販賣機產業,我們絕不會僱用 Claude AI。



