谷歌剛剛宣布,Gemini 很快就能在手機上執行某些多步驟任務,例如訂餐或訂車,首先是 Pixel 10、Pixel 10 Pro 和剛發布的三星 Galaxy S26 手機。這一切看起來都像是蘋果在 2024 年全球開發者大會上宣布的 Siri 功能——之後蘋果將這些計畫中的功能推遲到 2025 年 3 月, 尚未發布的。
在舞台上,Google Android 總裁 Sameer Samat 展示了 Gemini 的新功能如何幫助他從繁忙的家庭聊天中解決披薩晚餐訂單。 Samat 要求 Gemini 查看聊天線程並弄清楚要訂購什麼,然後使用送貨應用程式下訂單。在螢幕上——在預先錄製的影片中,它不是即時的——你可以看到 Gemini 弄清楚每個人想要從群組聊天中得到什麼,並將其顯示在一個視窗中。然後,用戶透過語音請求告訴 Gemini 透過命名特定的比薩店來完成此訂單。然後 Gemini 點擊 Grubhub 來準備訂單,一切仍然在螢幕上。當訂單準備好時,Gemini 會發送通知,以便用戶可以檢查訂單並實際點擊提交按鈕。
並且不說這種情況不會出現 那 在 Grubhub 應用程式中自行完成(甚至打電話給比薩店與人討論)很複雜,這對人工智慧代理商來說是一個潛在的重要時刻。 Google最近為 Chrome 用戶添加了 Gemini 自動瀏覽功能,並且能夠在 Android 中執行類似的操作似乎是合乎邏輯的下一步。谷歌顯然希望 Gemini 被視為輔助代理或生產力合作夥伴,而不僅僅是聊天機器人或一系列人工智慧模型。
假設 Gemini 的代理功能也像谷歌承諾的那樣「很快」推出,並且蘋果也沒有變出任何東西,那麼谷歌還將在 WWDC 2024 展會上的一些更令人印象深刻的 Apple Intelligence 演示中擊敗蘋果,這些演示也僅在預先錄製的視頻中展示。蘋果展示的一項功能可以讓 Siri 了解你螢幕上的內容並對其採取行動,這意味著你可以要求 Siri 將訊息線程中的地址添加到你正在發送訊息的聯絡人名片中。 Apple 展示了 Siri 如何在應用程式內和應用程式之間為您執行操作。該公司表示,Siri 甚至可以理解你的個人背景,這意味著你可以詢問它你媽媽的航班何時降落,然後助理會從電子郵件中提取資訊並將其顯示給你。
差不多兩年後,這些都不再可用。當蘋果宣布這些功能將被推遲時,該公司甚至發布了一則廣告來展示這些功能。並根據報告 彭博社某些功能可能不會出現在 iOS 27 中。
當然,關於 Gemini 的新功能仍然存在許多疑問。他們需要實際發貨。我們必須對它們進行測試,看看它們是否像宣傳的那樣有用和功能齊全——谷歌稱這個初始版本為“測試版”,因此可能存在一些粗糙的地方。我們不知道有多少開發者實際上會讓 Gemini 代表用戶瀏覽他們的應用程序,誰 唇 主編 Nilay Patel 喜歡將這個問題稱為 DoorDash。 (Google表示 Gemini 將能夠在「精選共享和餐飲應用程式」中工作。)
但谷歌似乎已經在很大程度上超越了蘋果,而現在蘋果需要做更多的工作才能趕上。








