蘋果研究人員團隊著手了解真實用戶對人工智慧代理的期望以及他們喜歡如何與人工智慧代理互動。這是他們的發現。
蘋果探索人工智慧代理時代的使用者體驗趨勢
在這項題為「繪製基於計算機的代理的用戶體驗設計空間」的研究中,由四名蘋果研究人員組成的團隊表示,雖然市場在開發和評估人工智能代理方面投入了大量資金,但用戶體驗的某些方面卻被忽視了:用戶可能希望如何與它們交互以及這些界面應該是什麼樣子。
為了探索這一點,他們將研究分為兩個階段:首先,他們確定了人工智慧實驗室正在建置到現有人工智慧代理中的核心使用者體驗模式和設計功能。然後,他們使用一種名為「綠野仙蹤」的有趣方法,透過實際使用者研究來測試和完善這些想法。
透過觀察這些設計模式如何在真實的使用者互動中持續存在,他們能夠確定哪些當前的人工智慧代理設計滿足了使用者的期望,哪些未能滿足使用者的期望。
第一階段:分類
研究人員研究了九種桌面、行動和網路代理,包括:
- 克勞德電腦使用工具
- 行家
- 運營商OpenAI
- 愛麗絲
- 磁力使用者介面
- UI-TARS
- 水手計劃
- 計程車人工智慧
- 自動GLM
然後,他們諮詢了“在一家大型科技公司從事 UX 或 AI 工作的 8 名執業設計師、工程師或研究人員”,這幫助他們提出了一個全面的分類法,其中包含 4 個類別、21 個子類別和 55 個示例功能,涵蓋了 AI 計算機代理的關鍵 UX 方面。
四個主要類別包括:
- 定制要求:使用者如何輸入命令
- 機構活動的可解釋性:向使用者提供有關代理操作的哪些信息
- 使用者控制:使用者如何干預
- 心理模型和期望:如何幫助使用者了解代理的能力
本質上,這個框架涵蓋了從允許代理商向用戶展示其計劃的介面各個方面,到他們如何傳達其功能、檢測錯誤以及允許用戶在出現問題時進行幹預的所有內容。
有了這些,他們就進入了第二階段。
第二階段:研究《綠野仙蹤》
研究人員招募了 20 名已經使用過 AI 代理經驗的用戶,並要求他們透過聊天介面與 AI 代理進行交互,以完成度假租賃任務或線上購物任務。
來自研究:
參與者獲得了一個聊天使用者介面的模型,透過該模型他們可以與研究人員扮演的「代理」進行互動。在本例中,也向參與者呈現了一個代理執行介面,研究者作為代理,根據參與者的命令與螢幕上的 UL 進行互動。在使用者聊天介面中,參與者可以用自然語言輸入文字查詢,然後該文字查詢就會出現在聊天執行緒中。然後「代理」繼續執行,研究人員控制身邊的滑鼠和鍵盤來模擬代理在網頁上的動作。當研究人員完成任務時,他輸入一個熱鍵,在聊天線程中發布一條「任務已完成」訊息。在執行過程中,參與者可以使用中斷按鈕來停止代理,聊天中會出現「代理已中斷」的訊息。
換句話說,在使用者不知道的情況下,人工智慧代理實際上是一位坐在隔壁房間的研究人員,閱讀文字指令並執行請求的任務。
對於每項任務(度假租賃或線上購物),參與者被要求使用人工智慧代理執行六項功能,其中一些代理要么故意失敗(例如,陷入導航循環),要么故意犯錯(例如,選擇與用戶指示不同的東西)。
在每次會議結束時,研究人員要求參與者反思他們的體驗,並提出改進體驗的功能或改變。
他們還分析了每個會話的視訊記錄和聊天日誌,以確定與代理互動時用戶行為、期望和痛點中反覆出現的主題。
主要發現
歸根結底,研究人員發現用戶希望看到人工智慧代理在做什麼,但不想對每一步進行微觀管理,否則他們可能只是自己完成任務。
他們還得出結論,用戶想要不同的代理行為,這取決於他們是在探索選項還是執行熟悉的任務。同樣,使用者的期望也會根據他們對介面的熟悉程度而改變。他們越不熟悉,就越需要透明度、中間步驟、解釋和暫停確認(即使在低風險情況下)。
他們還發現,當行為產生實際後果時(例如購買、更改帳戶或付款詳細信息,或代表他們聯繫其他人),人們希望獲得更多控制權,並且還發現,當代理做出默認假設或錯誤時,信任很快就會消失。
例如,當代理商在頁面上遇到不明確的選擇或偏離原始計劃而沒有明確指出時,參與者會要求系統暫停並要求澄清,而不是簡單地選擇看似隨機的內容並繼續前進。
同樣,當代理人對選擇不透明時,參與者會感到不安,特別是當該選擇可能導致選擇錯誤的產品時。
總的來說,對於希望在其應用程式中實現基於代理的功能的應用程式開發人員來說,這是一項有趣的研究,您可以在此處閱讀完整內容。
亞馬遜上的配件優惠
FTC:我們使用自動會員連結來產生收入。 更多的。










