編碼氛圍 當您了解過程的要點時,這會很有趣。就像與人交談一樣簡單 人工智慧聊天機器人 並為您編寫了一個應用程序,但需要時間和耐心來排除故障。我創造了很多 氛圍編碼項目但總是有新的方法來測試這些結果有多好,特別是當您考慮您正在使用的模型時。
有這麼多的人工智慧模型可供涉足,它們可能會產生截然不同的結果,特別是如果你心中沒有一個可靠的計劃。我想看看更輕的模型與 Google 和 OpenAI 所說的「思考」模型相比有何不同。這些較輕的型號的名稱有所不同:Google 的 Gemini 介面將其稱為 Fast(儘管模型實際上稱為 Gemini 2.5 Flash),而 OpenAI 則將其稱為 Instant。
我決定使用兩個模型進行實驗來創建相同的專案。首先,我使用 Google 的 Gemini 3 Pro 從頭到尾建立了一個項目,並想使用其中一款較輕的型號複製它,嘗試進行相同的對話。當時最新的輕量級機型是Gemini 2.5 Flash。結果很能說明問題:兩者都產生了相同的效能,但兩者的實現過程卻截然不同。
我對這個實驗缺乏靈感,所以我把它放在了雙子座上。我讓他找到我可以運行的有趣的編碼氛圍項目,我選擇了一個名為“獎杯展示櫃”的項目。我要求 Gemini 顯示恐怖電影列表,而不是獎杯,並在您單擊其中一張海報時提供有關它們的更多資訊。除了這些要求之外,我還對兩個 Gemini 模型進行了創造性的控制。
快速且深思熟慮的人工智慧模型:有什麼區別?
如果 Google 讓我們在 Flash 和 Pro 型號之間進行選擇,那麼它們一定是根本不同的,對吧?是和不是。它們都是主要的語言模型,但工作方式不同。對於日常用戶來說,「快速」和「周到」很好地定義了兩者之間的差異:速度與深度。
推理模型是一種經過最佳化的法學碩士,可在產生最終結果之前將複雜問題分解為較小的步驟。這是透過執行內部思維路徑推理鏈來完成的。 Gemini 2.5 Flash 和 Gemini 3 Pro 都是推理模型,但 Gemini 2.5 Flash 採用了混合方法:它在速度和推理之間提供了平衡。
Gemini 3 Pro 是最強大的推理模型,並針對深入挖掘尋找答案進行了最佳化。因此,它比 2.5 Flash 等更有效率的型號慢。谷歌此後推出了 雙子座3閃光取代 2.5 Flash 的更強大的基本型號。對大多數人來說,Gemini 3 Pro 仍然是 Gemini 中最強大的邏輯模型。
Gemini 3 Pro 型號完成了大部分工作
Gemini 3 Pro 製作的最終作品並不完美,但它比我最初的想法要好,並且比 Gemini 2.5 Flash 製作的作品領先一英里。
使用 Gemini 3 Pro,我能夠創建一個登陸頁面,其中包含我列表中的電影和海報圖像,當您單擊標題時,它會打開一個頁面並顯示其他信息,以及在 YouTube 上觀看預告片的鏈接。這不是一個複雜的項目,但一路上我遇到了很多問題和錯誤。
我最初希望將預告片嵌入到頁面上,但它不斷拋出 Gemini 無法修復的錯誤,因此它縮減為僅提供連結圖像以在 YouTube 上觀看預告片。很好,但無縫體驗比我想要的少。話雖這麼說,我很欣賞 Gemini 3 Pro 詳細說明了該功能所遇到的具體問題,並讓我決定刪除它。
Gemini 3 Pro 多次嘗試解決的另一個問題是它所描述的延遲問題。當您單擊海報時,會出現一個包含電影詳細資訊的彈出窗口,以及一個退出該視圖的小按鈕,儘管它從未起作用。我四次要求 Gemini 修復這個問題,直到最後一次請求才修復問題。 Gemini 粗略地解釋了他對程式碼的用途,但從未詳細說明過,儘管我想如果我問的話他會的。
最初的項目只是展示一系列電影並獲取有關它們的更多資訊的一種方式。此外,我沒有考慮任何關於風格或使網頁應用程式變得有趣的方法,而 Gemini 3 Pro 在這方面很有幫助。當我問如何讓應用程式在設計和功能方面變得更好時,他建議為影片添加 3D 捲軸效果和隨機選擇選項。
該專案進行了近 20 次迭代。最終的產品與預期的一樣好,這是一個有趣的項目,但 Gemini 經常無法解決一些問題。最終的產品超出了我的預期,所以我很滿意。但由於我遇到了所有問題,我開始想知道快速的 Gemini 模型將如何處理相同的任務。
使用 Gemini 2.5 Flash 進行 Vibe 編碼更加手動
正如預期的那樣,使用「快速」模型比 Gemini 3 Pro 更快,但大多數時候該模型建議使用更多手動方法來尋找專案的解決方案。人工智慧工作速度很快,但為我創造了更多但更慢的工作。
例如,我希望 Web 應用程式能夠顯示清單中每部電影的海報和劇情簡介,但我從未想過如何產生這些資訊。在沒有具體詢問的情況下,Gemini 3 Pro 建議我註冊電影資料庫並獲取 API 金鑰來自動提取這些詳細信息,Gemini 2.5 Flash 基本上告訴我「獲取」圖像並從那裡開始。我如何獲得這些圖像似乎取決於我。
與 Gemini 3 Pro 相比,Gemini 2.5 Flash 有時給人一種近乎懶惰的感覺。 Gemini Pro 型號會在不提示您的情況下執行某些操作,但 Flash 需要更具體的提示。有時,我覺得我在提示一個正在聽指示但故意避免做家事的孩子。
在很多情況下,當我要求 Gemini 2.5 Flash 進行更改後,它確實做了並提供了更新的程式碼,但僅限於它修改的特定部分。然後它會指示我將舊程式碼更改為新程式碼。如果您知道自己在尋找什麼,那麼將一段程式碼替換為另一段程式碼可能並不是什麼大問題,但這就是編碼氛圍,如果您不知道將程式碼放在哪裡,即使這是一項非常簡單的任務,也可能會讓一些用戶望而卻步。可以把氣氛搞亂。
此外,Gemini 2.5 Flash 建議我簡單地「獲取」電影海報圖像和其他詳細資訊。因此,在打破實驗參數的限制,只在兩個專案中使用相同的提示(充其量是寬鬆的)的同時,我決定詢問 Gemini 2.5 Flash 對於為電影資料庫添加 API 金鑰的想法有何想法。他對這個想法表示歡迎,並告訴我在哪裡添加密鑰。相反,我要求模型添加我提供的密鑰。他添加了密鑰,但是當我運行網頁應用程式時,它實際上並沒有從我引用的電影中提取海報圖像,所以我不得不要求他再次修復它。該模型解決了其局限性,表示:“在初始列表中查找每部電影的確切 TMDB ID 非常耗時,但我會用盡可能多的已確認 ID 填充數組,以使集合精確到您請求的列表。”
如果他做了他說他會做的事情,我沒有註意到。與填充其中的各種不同電影相比,我提供的清單中的每場比賽都感覺像是巧合。儘管如此,儘管 99% 填寫的電影海報都是錯誤的,但理論上它仍然使我不必手動添加圖像本身。相反,Gemini 3 Pro 一次就填滿了所有正確的電影海報。
編碼氛圍時速度與思考模型有何不同
每次我要求Gemini的思維模型進行調整時,它都會做出改變並立即重寫所有程式碼,這樣我就可以將整個程式碼複製並貼上到我想要的地方,而不必知道程式碼更新在哪裡。
Gemini 2.5 Flash 有所不同。在進行了一些小調整後,他給了我程式碼並告訴我用現有的程式碼取代它。為了避免這種情況,我要求他重寫完整的程式碼,這樣我就不必更改任何內容。他的回答是:「這是一個很大的問題。」雖然當時看來我的要求比這個高很多,但與 Gemini 3 Pro 相比還是有點蛋疼。
作品
Gemini 2.5 Flash 做了一些可行的工作,但即使在嘗試修復錯誤之後仍然充滿錯誤。
在我的測試結束時,這兩種型號都不是完美的,但 Gemini 3 Pro 明顯更容易使用。雖然這兩種模型在另一個專案中可能會產生非常相似的結果,但到達最終目的地可能會遵循兩條截然不同的路徑。
使用 Gemini 2.5 Flash 時,您需要具體說明您想要它做什麼,並準備好在它看起來需要快捷方式時修復它。需要實踐和經驗,包括與其他人工智慧模型的合作,才能確定模型何時走了可能影響專案的捷徑。如果這是您使用的唯一模型,那麼您應該更加勤奮地對待它。
Gemini 3 Pro 名副其實。他不僅處理了這個專案的繁重工作,而且還提供了有用的建議,將其從我開始的基本概念中提升了出來。






:format(jpg):quality(99):watermark(f.elconfidencial.com/file/65c/43d/0ca/65c43d0ca5dbd5ff8f19b44167343db9.png,0,275,1)/f.elconfidencial.com/original/ae8/ef9/faf/ae8ef9faf3dd16cf9ca5abda65a7031f.jpg)


