谷歌多年來一直致力於即時翻譯,並稱這是其「機器學習領域的開創性實驗」之一。我們過去在 Google 活動中看過許多舞台演示,但您需要 Google 手機、耳塞或其他一些特定設定。去年,Google在翻譯應用程式中向更多用戶引入了即時翻譯,現在正在進一步擴大可用性。隨著 Gemini 3.5 即時翻譯的發布,您將可以在更多地方以比以往更低的延遲進行即時翻譯。
新的 AI 模型是 I/O 上推出的 3.5 版本系列的一部分。在今天之前,Google只發布了 Flash 版本,但我們預計 Pro 版本將在未來幾週內發布。 Gemini 3.5 Live Translate 是一種語音轉語音模型,可自動偵測和翻譯 70 多種語言。
谷歌表示,Gemini 3.5 即時翻譯速度夠快,足以跟上正常對話的速度,只需落後說話者幾秒鐘,同時還能匹配語調、速度和音調。簡而言之,它聽起來更像你而不是普通機器人。這些演示都是在受控條件下錄製的,聽起來令人印象深刻。您無需等待很長時間即可親自檢查模型的功能。
使用 Gemini 3.5 即時翻譯翻譯 Google Meet 中的演講。
Gemini 3.5 Live Translate 正在 Google 生態系統的多個部分推出。開發人員可以透過 Gemini Live API 或 AI Studio 中的公開預覽開始建置。該模型連續處理語音並自動處理所有多語言輸入,使開發人員無需手動配置設定。它還可以過濾擁擠環境中的背景噪音。
發布日期: 2026-06-09 19:57:00
來源連結: arstechnica.com










