歐洲廣播聯盟 (EBU) 和英國廣播公司 (BBC) 週三發布的最新研究顯示,領先的人工智能助手近一半的回答都歪曲了信息。
這項國際研究調查了領先的人工智能助手對新聞問題的 3,000 個回答,這些助手是使用人工智能理解自然語言命令來為用戶執行任務的軟件應用程序。
它對 14 種語言的人工智能助手的準確性、來源和區分觀點與事實的能力進行了評級,包括 OpenAI 的 ChatGPT、微軟的 Copilot、谷歌的 Gemini 和 Perplexity。
研究發現,總體而言,45% 的人工智能回答至少包含一個重大問題,而 81% 的回答存在某種問題。
根據路透社研究所的《2025 年數字新聞報告》,大約 7% 的在線新聞消費者和 15% 的 25 歲以下消費者使用人工智能助手來獲取新聞。
路透社已聯繫這些公司,尋求他們對調查結果發表評論。
公司表示他們希望改進
谷歌的人工智能助手Gemini此前在其網站上表示,歡迎反饋,以便能夠繼續改進該平台,使其對用戶更有用。
OpenAI 和微軟此前曾表示,幻覺——當人工智能模型生成不正確或誤導性信息時,通常是由於數據不足等因素造成的——是他們試圖解決的一個問題。
Perplexity 在其網站上表示,其“深度研究”模式之一的事實準確度高達 93.9%。

人工智能助手經常犯採購錯誤
根據這項研究,人工智能助理的回復中有三分之一存在嚴重的來源錯誤,例如缺失、誤導或錯誤歸因。
報告稱,谷歌人工智能助手 Gemini 的回復中,約 72% 存在嚴重的採購問題,而所有其他助手的這一比例不到 25%。
在所有接受調查的人工智能助手的回復中,有 20% 的人發現了準確性問題,包括過時的信息。
CBC/Radio-Canada、Postmedia、Metroland、多倫多星報、環球郵報和加拿大報社對 ChatGPT 製造商 OpenAI 發起聯合訴訟,指控其使用新聞內容訓練其生成人工智能係統 ChatGPT。新聞機構稱 OpenAI 從其網站上刪除“內容”,侵犯了版權。
該研究引用的例子包括 Gemini 錯誤地報告了一次性電子煙法律的變化,以及 ChatGPT 在教皇方濟各去世幾個月後就將其報告為現任教皇。
來自 18 個國家的 22 家公共媒體機構,包括加拿大廣播公司 (CBC) 和加拿大廣播電台 (Radio-Canada),以及來自法國、德國、西班牙、烏克蘭、英國和美國的其他媒體機構參與了這項研究。
EBU 表示,隨著人工智能助手越來越多地取代傳統新聞搜索引擎,公眾的信任可能會受到損害。
EBU 媒體總監 Jean Philip De Tender 在一份聲明中表示:“如果人們不知道該相信什麼,他們最終就會什麼都不相信,這會阻礙民主參與。”
EBU 的報告敦促人工智能公司改進其人工智能助手響應新聞相關查詢的方式,並更加負責任,並列舉了新聞機構本身如何擁有“強大的流程來識別、確認和糾正錯誤”的例子。
報告稱:“確保人工智能助手承擔同樣的責任非常重要。”











