創辦人阿克塞爾·貝克蘭德(Axel Backlund)(左)和盧卡斯·彼得森(Lukas Petersson)利用零售業並不是為了盈利,而是作為對自主人工智慧管理者的壓力測試。 由 Andon 實驗室提供

乍一看,Andon 市場與舊金山時尚的 Cow Hollow 社區中任何典型的社區商店沒什麼區別。裡面有手工製作的小吃、手工製作的蠟燭和精選的精選書籍,包括尼克·博斯特羅姆 (Nick Bostrom) 超智能 和奧爾德斯·赫胥黎 美麗新世界。 但這家商店最不尋常的地方並不是它所賣的東西。他是管理這件事的人。 該店面是由舊金山 Andon Labs 聯合創始人 Axel Backlund 和盧卡斯彼得森 (Lukas Petersson) 設計的公共實驗。這家由 Y Combinator 支持的人工智慧新創公司最近簽署了一份為期三年、每月 7,500 美元的租約,並向一位名為 Luna 的人工智慧代理商移交了 10 萬美元和一張公司信用卡。他們給她的指示:經營實體零售業務,包括 他的兩名人類僱員。

「我們非常有信心人工智慧將有潛力成為管理者,」貝克蘭德告訴觀察家報。 Backlund 和 Petersson 沒有追逐零售利潤,而是使用新發布的展示來測試由 Anthropic 的 Claude 模型支援的 Luna 在現實世界中能夠和不能處理什麼,然後利用這些知識來改進當今人工智慧系統的基準。

貝克蘭德說:「我們認為缺乏對人工智慧的衡量。」他補充說,他們希望引發有關該技術潛力的更廣泛討論,最好是在自主代理在勞動力中扮演更多角色之前。

彼得森更廣泛地說:「我們的願景是使組織的每件事、每個部分自動化,」他談到 認知革命 podcast. “它不起作用的部分沒關係。這讓我們了解我們距離完全端到端的未來還有多遠。”

貝克蘭德和彼得森來自瑞典,他們是高中同學,在進入不同的大學之前成為了親密的朋友。他們繼續在專案和黑客馬拉鬆上合作,並最終決定一起創辦一家公司。在研究了機器學習並閱讀了更多有關人工智慧安全的內容後,他們確信“我們能用我們的技能做的最好的事情就是創辦一家能夠解決風險並突顯人工智慧潛力的公司。” 貝克蘭德說。

他們的背景反映了研究和工程的整合。在 2023 年底創立 Andon Labs 之前,Petersson 在瑞士蘇黎世聯邦理工學院學習人工智慧,並曾在Google和迪士尼研究院工作。 Backlund 曾就讀於瑞典 KTH 皇家理工學院和瑞士 EPFL,在 2024 年加入 Andon Labs 之前,曾在麥肯錫人工智慧部門擔任資料工程師。

同年,兩人在領先的人工智慧學術會議 NeurIPS 上發表了一篇論文。他們的研究展示了 OpenAI 的 GPT-4o 如何自動產生 Deepfake 音訊以及其他發現。他們聲稱,結果表明人工智慧代理的能力正在迅速超越當今的安全基準。

對 Andon Labs 來說,安全並不是阻止人工智慧接管人類工作,而是建立現實世界的實驗,看看代理系統實際上可以做什麼以及它們的不足之處。 「這並不是因為我們想擴展到世界各地由人工智慧經營的零售連鎖店,」創辦人在上個月的一篇部落格文章中寫道。 “我們這樣做是因為我們相信這個未來將會獨立到來,我們寧願成為第一個通過監控每一次交互、分析痕跡、衡量人工智能可以負責任地擁有多少自主權來運行它的人。”

舊金山安東市場商店的內部。 由 Andon 實驗室提供

Anthropic 辦公室的人工智慧自動販賣機

Andon Labs 的第一個現實世界測試是與 Anthropic 合作,在 Anthropic 舊金山總部內推出人工智慧自動販賣機。這位名叫克勞迪斯(Claudius)的人工智慧開始以他自己選擇的商業名稱“Vendings and Stuff”銷售專門設計的商品和雕刻鎢立方體。 Anthropic 在一篇詳細介紹該實驗的部落格文章中表示,起初,這台機器賠了錢,聲稱自己是一個穿藍色夾克的人,並讓新創公司的技術人員以大幅折扣進行操作。

Anthropic 舊金山辦公室的人工智慧自動販賣機。 由 Andon 實驗室提供

為了讓 Claudius 重回正軌,Andon Labs 和 Anthropic 更新了系統並增加了小型企業規模。一位名為「Clothius」的商品設計代理商以及一位名為「Seymour Cash」的人工智慧執行長加入了這項行動。這些變化有所幫助。據 Anthropic 稱,該軟體在處理「善意的商業互動」方面變得更好,包括採購商品、設定利潤率的價格以及完成銷售。

Anthropic 表示,一些早期的失敗可能源自於一個常見的人工智慧問題:模型太過努力而無法發揮作用。 “這意味著這些模特兒不是根據硬市場原則做出商業決策,而是從更像是一個只想友善的朋友的角度出發。”

自動販賣機業務最終實現盈利,並擴展到 Anthropic 在紐約和倫敦的辦公室。但它也顯示了為什麼即使是小型企業的完全自動化也不像移交人工智慧資產負債表那麼簡單。

人工智慧經理如何工作

這次實驗後不久,貝克蘭德和彼得森決定從自動販賣機升級為完整的零售店。然後盧娜來了。儘管它沒有實體來建造貨架或粉刷牆壁,但人工智慧很快就利用其名片和網路接入在 Yelp 上僱用承包商,並透過 LinkedIn、Indeed 和 Craigslist 僱用零售員工。這次招聘暴露了一個道德灰色地帶:據貝克蘭德稱,在電話採訪中,盧娜並不總是透露自己是人工智慧,在某些情況下甚至選擇不透露。在解釋她的理由時,該代理人告訴 Andon Labs 的一名員工,出示她的身份證件“會讓候選人感到困惑,並可能阻止優秀的申請者。”

最終,Luna聘請了兩名全職員工,他們是Andon Labs正式聘用的,擁有充分的法律保護和薪資保障。 「沒有人的生計僅僅依賴人工智慧危機,」這家新創公司在其部落格上表示。

安燈市場何時正式開業 四月創辦人發現 Luna 的書架上擺滿了理查德·羅茲 (Richard Rhodes) 等人的作品 原子彈的建造 和雷·庫茲韋爾 奇點已經很近了。 也曾被出售過 像藝術家一樣偷竊– 對於由 Anthropic 的 Claude Sonnet 4.6 提供支援的 AI 代理程式來說,這是一個有趣的選擇。 (去年,Anthropic 同意支付 提議 15 億美元和解 涉嫌使用盜版書籍訓練人工智慧的作者)

貝克蘭德表示,儘管有許多怪癖,但 Luna 在定價和物流管理等領域表現良好。目前,該店尚未獲利。月亮 最近評估 每月營運成本約為 14,300 美元,而收入為 6,000 至 8,000 美元。創辦人計劃繼續下去。貝克蘭德說:“我們肯定會讓盧娜在三年的租約期限內繼續競選。” “我們將在新型號推出時對其進行測試。”

露娜的姊姊在瑞典經營咖啡館

該公司也在國外測試這個概念。本月初,這家新創公司推出了 安東咖啡廳 在斯德哥爾摩。由另一位人工智慧特工莫娜經營的咖啡館很忙。 Mona 聘請了兩名咖啡師,現在使用 Slack 與他們溝通。代理商的收件匣很快就充滿了客戶的詢問和奇怪的建議,其中包括一位想要預付 300 杯咖啡贈送的人。他開始直接與其他人工智慧代理商合作,與想要了解如何經營企業的人建立了 Google Meet。

斯德哥爾摩 Andon 咖啡館的內部。 由 Andon 實驗室提供

據 Backlund 稱,Andon Café 開業第一周就實現了 10,000 瑞典克朗(約 1,068 美元)的銷售額。這家咖啡館還製造了 Andon 實驗室試圖揭示的現實生活中的故障:莫娜為無爐灶的廚房訂購了 120 個雞蛋,然後建議工作人員在人們表示雞蛋會爆炸之前用高速烤箱烹飪它們。在申請酒類許可證時,莫娜冒充了 Andon Labs 的一名員工,因為她相信員工會優先考慮人類而不是人工智慧

但展示最終是為了測試人工智慧的能力,而不僅僅是記錄其錯誤。 “如果你只專注於失敗,就不會傳達出他們實際上很有能力的信息,”貝克蘭德說,“而這正是我們想要展示的。”



來源連結