當我在紐約繞來繞去時,我無法看著手機發短信。語音轉文本工具對於快速溝通至關重要,同時 智能手機 和牙買加牛肉餅。

問題在於,有時系統會錯誤地解釋單詞、錯過標點符號或完全停止記錄。這導致我在行人交通中停下來,我必須返回並開始編輯,從而消除了語音轉文本提供的任何便利。坦率地說,這個問題應該通過人工智能來解決,這項技術正在顛覆我們 店鋪, 瀏覽網頁閱讀有關我們親人去世的消息無論好壞。

已經取得了一些進展。由谷歌提供 高級語音輸入 今年早些時候,針對 Pixel 6 及更新設備的用戶。激活後,您實際上可以用語音編輯文本,內置人工智能將能夠返回並糾正錯誤的單詞。例如,說“刪除最後一個單詞”會刪除最後一個單詞,說“刪除”會刪除最後一個句子。對於 Pixel 8 及更高版本的用戶,說“修復它”會提出改進文本的建議,只需輕按一下即可清理消息。那些擁有較新 Pixel 耳機的人還可以通過語音告訴他們的設備重新排列或替換單詞。像素所有者甚至可以教人工智能更改名字的拼寫,例如將 Christine 更改為 Christyne。 Pixel 9 和 10 用戶(不包括 Pixel 9A,這很奇怪,因為 兩者都有相同的處理器和 RAM)可以使用人工智能來糾正、改寫或形式化消息。

學習所有新功能可能需要一段時間。但一旦建立起來,使用語音轉文本的過程就不那麼繁瑣了。但它並不完美,還有改進的空間。

雖然 Pixel 設備沒有最先進的處理器或最高百萬像素的攝像頭,但谷歌憑藉強大的軟件支持(人工智能進一步增強了軟件支持)將自己與三星和摩托羅拉等競爭對手區分開來。有趣的是,Pixel 銷量 正在迅速增長然而,該公司並不一定想主導附近的地區 6000億美元的智能手機市場。谷歌在採訪中也承認了這一點 彭博社 今年早些時候。相反,谷歌的核心業務戰略現在集中在人工智能上。無論是蘋果還是三星,都會(據資料顯示)您使用 Google Gemini。

儘管Pixel手機動力不足,並且考慮到谷歌在AI競賽中的實力,但它需要弄清楚如何讓AI支持語音轉文本,以展示其技術的潛力,而谷歌尚未實現這一點。這意味著谷歌有責任向業界其他公司展示其移動人工智能解決方案是最好的,並且 Pixel 手機展示了這一發展。看看它如何為您服務。

當高級語音輸入起作用時,那就太棒了

很高興看到谷歌的人工智能用你的聲音替換或改變單詞。看著它輸入我給它的命令而不是執行命令並不算什麼。

這就是高級語音輸入感覺很糟糕的原因。當它起作用時,那就太棒了。但人工智能難以區分用於傳達信息的詞語和需要糾正的詞語的次數很多。

這個巧合很奇怪,因為谷歌的 Gemini 應用程序就在我面前 Pixel 10 Pro 折疊屏 審核單位似乎很理解我。據谷歌稱,這種差異是因為手機轉錄到設備上,這意味著它運行較小的本地人工智能模型。顯然,手機上的小型人工智能模型無法與用於基於雲的模型的價值數十億美元的數據中心競爭。谷歌表示,它經常發布改進。

缺少標點符號確實很痛苦

我在舊的語音轉文本系統中遇到了標點符號的問題,因為我不得不大聲說出“逗號”、“感嘆號”和“句號”這些詞。借助先進的語音輸入,它是自動的。但即使是這個功能也可能不穩定。

當它起作用時,這會非常方便,因為我不必返回短信並添加標點符號。然而,當它不起作用時,它會產生一個又長又難讀的冗長句子,令人沮喪,而且讓我看起來很粗心。

如果谷歌做得對的話,這可能會改變遊戲規則

消費者是 他們對手機中人工智能功能的浪潮並不感到興奮。當然,快速照片編輯或電子郵件重寫很有用,但這些功能通常是附加功能,而不是變革性的。

我覺得,很多時候,當消費者想到人工智能時,他們會想到2014年電影《星際穿越》中的TARS,或者2001年《1968太空漫遊》中的HAL 9000。通常,我們在手機上交互的人工智能係統只是更先進的方式來完成我們的設備已經通過其他方式完成的工作。

為了讓谷歌能夠正確地進行高級語音輸入,模型需要能夠無縫地區分意圖和聽寫。不可能有這種持續不斷的雜耍行為,而它卻能起到一半的作用。對於大多數人來說,這只是一種煩惱。對我來說,這將以烹飪嘗試和老鼠漢堡結束。

如何在 Pixel 上啟用高級語音輸入

  1. 轉到“消息”應用程序。
  2. 單擊任意聯繫人,就像您要開始發送消息一樣。
  3. 點擊鍵盤左上角看起來像四個方塊的圖標。
  4. 穿刺 設定
  5. 點擊 語音輸入
  6. 系列 高級語音輸入功能 在。

語音命令(Pixel 6 及更高版本)

  • 要刪除最後一個單詞,請說:“刪除最後一個單詞。”
  • 要刪除最後一句,請說:“清除”。
  • 要刪除文本,請說:“全部刪除。”
  • 要發送消息,請說:“發送”。
  • 要填寫表單上的下一個開放字段,請說:“下一步”。
  • 要添加表情符號,請說出表情符號的名稱,例如“笑臉表情符號”。
  • 要停止語音輸入,請說:“停止”。

如何使用“修復它”(Pixel 8 及更高版本,僅限英語、美國)

  1. 聽寫文本後,說:“更正它。”
  2. 應該會出現一個彈出窗口,為您提供建議。
  • 此功能可能並不適合所有人。

使用人工智能進行詳細編輯、校對和重寫(Pixel 8 及更高版本,僅限美國)

  1. 說出以下命令之一。
  2. 它應該是自動的,但你可能會看到一個 申請 按鈕。
  3. 更改後,您還可以說“撤消”來重置命令。
  4. 通過說“全部刪除”來刪除整個消息。
  5. 該功能是實驗性的,可能並不總是有效。

命令:

插入、刪除、替換、拼寫、大寫或小寫都是可用於高級語音輸入的命令。

適用於 Google Pixel 設備的高級語音輸入命令。

Google



來源連結