像 ChatGPT 這樣的人工智能係統能否產生原創想法?由蒙特利爾大學心理學系的 Karim Jerbi 教授領導的一項新研究,在著名人工智能研究員 Yoshua Bengio 的參與下,以前所未有的規模回答了這個問題。這項研究是有史以來對人類創造力和大型語言模型的創造力進行的最大規模的直接比較。
研究發表於 科學報告 (自然組合)代表了一個重大變化。創造性的人工智能係統已經達到了在某些創造力方面超越普通人類的水平。與此同時,最有創造力的人仍然比最強大的人工智能模型表現出明顯且一致的優勢。
人工智能達到人類創造力的平均水平
研究人員評估了幾種領先的大型語言模型,包括 ChatGPT、Claude、Gemini 等,並將它們的性能與超過 100,000 名人類參與者的結果進行了比較。研究結果凸顯了一個明顯的轉折點。一些人工智能係統,包括 GPT-4,在旨在衡量不同語言創造力的任務上表現優於人類平均得分。
“我們的研究表明,一些基於大型語言模型的人工智能係統可以在明確定義的任務中超越人類的平均創造力,”Karim Jerbi 教授解釋道。 “這個結果可能令人驚訝,甚至令人震驚,但我們的研究還強調了一個同樣重要的觀察結果:即使是最好的人工智能係統也遠遠低於最有創造力的人類所達到的水平。”
該研究的第一作者、博士後研究員 Antoine Bellemare-Pépin(蒙特利爾大學)和博士生 François Lespinasse(康考迪亞大學)揭示了一個驚人的模式。儘管現在一些人工智能模型的性能優於普通人,但最高的創造力仍然是人類。
事實上,當研究人員觀察最具創造力的一半參與者時,他們的平均得分超過了每個測試的人工智能模型的平均得分。在最具創造力的前 10% 的人中,這種差距甚至更大。
Mila 副教授 Karim Jerbi 教授表示:“我們與多倫多大學的 Jay Olson 合作,基於超過 100,000 名參與者的數據,開發了一個嚴格的框架,使我們能夠使用相同的工具來比較人類和人工智能的創造力。”
科學家如何衡量人類和人工智能的創造力
為了正確評估人類和機器之間的創造力,研究團隊使用了多種方法。主要工具是發散聯想任務(DAT),這是一種廣泛使用的心理測試,用於衡量發散創造力,或從單一提示中產生多樣化和原創想法的能力。
DAT 由研究合著者 Jay Olson 創建,要求人類或人工智能參與者列出十個沒有意義的單詞。創造性答案的一個例子包括“星系、叉子、自由、藻類、口琴、量子、懷舊、天鵝絨、颶風、光合作用”等詞語。
這項任務的表現與寫作、想法生成和創造性解決問題中使用的其他創造力測試的分數密切相關。儘管該任務是基於語言的,但它超出了詞彙範圍。它涉及許多領域的創造性思維的更廣泛的認知過程。 DAT 還具有實際優勢,因為只需兩到四分鐘即可完成,並且公眾可以在線獲取。
來自單詞列表的真正創意寫作
研究人員隨後研究了人工智能在這個簡單的單詞聯想任務中的成功是否可以擴展到更複雜和現實的創造性活動。為了測試這一點,他們比較了人工智能係統和人類參與者在創意寫作挑戰中的表現,例如創作俳句(一種簡短的三行詩形式)、撰寫電影情節摘要和創作短篇小說。
結果遵循了熟悉的模式。雖然人工智能係統有時表現優於普通人類,但最熟練的人類創造者始終創作出更強大、更具原創性的作品。
人工智能可以有創造力嗎?
這些發現提出了另一個重要問題。人工智能的創造力是固定的還是可以調整的?研究表明,AI的創造力可以通過改變技術設置,特別是模型的溫度來調整。此參數控制生成的響應的預測性或冒險性。
在較低的溫度下,人工智能會產生更安全、更規律的輸出。在較高的溫度下,反應會變得多樣化、難以預測且更具探索性,從而使系統能夠超越熟悉的想法。
研究人員還發現,創造力很大程度上受到說明書編寫方式的影響。例如,鼓勵模型使用詞源來思考單詞的起源和結構的問題會導致更多意想不到的關聯和更高的創造力得分。這些結果強調人工智能創造力依賴於人類指導,使得交互和創造力成為該過程的核心。
人工智能會取代人類創造者嗎?
這項研究對人工智能可能取代創意專業人士的擔憂提供了平衡的看法。雖然當今的人工智能係統在某些任務中可以匹配或超過人類的平均創造力,但它們仍然具有明顯的局限性並且依賴於人類的指導。
卡里姆·傑比教授表示:“儘管人工智能現在可以在某些測試中達到人類水平的創造力,但我們需要超越這種誤導性的競爭意識。” “創意人工智能已經成為服務於人類創造力的一個非常強大的工具:它不會取代創造者,但會深刻改變那些選擇使用它的人的想像、探索和創造的方式。”
研究結果並沒有預示著創意職業的終結,而是表明人工智能將在未來充當創意助手。通過擴展想法和開闢新的探索途徑,人工智能可以幫助增強而不是取代人類的想像力。
“通過直接面對人類和機器的能力,像我們這樣的研究鼓勵我們重新思考創造力的含義,”卡里姆傑爾比教授總結道。
關於考試
題為《人類與大語言模型的分歧創造力》的文章發表於 科學報告 2026 年 1 月 21 日。這項研究匯集了來自蒙特利爾大學、康考迪亞大學、多倫多大學密西沙加分校、Mila(魁北克人工智能研究所)和 Google DeepMind 的科學家。
Karim Jerbi 教授領導了這項研究,Antoine Bellemare-Pépin(蒙特利爾大學)和 François Lespinasse(康科迪亞大學)為第一作者。研究團隊還包括 Yoshua Bengio,他是 Mila 和 LoiZéro 的創建者,也是深度學習的先驅,深度學習是 ChatGPT 等現代人工智能係統背後的技術。









