Openai最近推出了GPT-5,這是最新的大語言模型,以及有關Chatgpt的大量更新。儘管新更新有很多事情,但主張是一回事,而現實是另一回事。

GPT-5據說更快,不太容易發生幻覺和誹謗行為,並且能夠在快速答案和飛行中更深入的“思考”中選擇。使用聊天機器人時,OpenAi的索賠中有多少個真正可見?讓我們學習。

索賠#1:現在最好按照說明進行操作

我對Chatgpt的主要問題,以及最近沒有被刪除的原因之一,是監視基本說明通常非常糟糕。當然,您可以從遺忘中要求它並獲得所需的結果(有時),但是即使是半模式的提示,也常常無法產生所需的結果。

Openai聲稱隨著GPT-5的發布,改善了“隨後的命令”。在這方面,我說:我還沒有看到。

對我來說幸運的是,我坐下來寫這篇文章的那一天,我與Chatgpt進行了適當的互動,這證明了我在這裡的觀點。但這不是唯一的一個,我通常注意到對話持續的時間越長,chatgpt就忘記了什麼。

在今天的示例中,我檢查了Chatgpt接收簡單信息並以所需格式呈現的能力。我詢問了RTX 5060 Ti規格,這是最近的圖形遊戲卡。緊隨其後的混亂。

為了使我的提示更加成功,我向chatgpt展示了我想獲取信息的確切表格,並分享了其他GPU的規格。它們包括諸如過程中心的確切樞紐以及核和峰的產生。長話短說,一切都很具體。最初,AI告訴我RTX 5060 TI尚不存在,這預計會根據削減知識而發生。我告訴他們在線控制。

我得到的是準骨。 Chatgpt省略了我要求的至少四件事,並給了我有關其中一個規格的錯誤信息。然後我要求確定一些事情。他給了我完全相同的清單,同時聲稱自己滿足了我的要求。第三次嘗試發生了同樣的事情。您可以在上面的屏幕截圖中看到它,其中Chatgpt聲稱已在列表中包括了峰和TFLOPS的創建 – 顯然沒有。

最後,半成熟的人,我正在從NVIDIA官方網站上推出一張屏幕截圖,以顯示我在尋找的內容。他仍然有幾件事。

我最初的勸告是半指的。我比像一個人一樣與AI交談更好,所以我給了大約150個單詞的指示。我甚至花了更多消息才能獲得我的預期結果。

判決: 仍然可以使用一些工作。

索賠#2:chatgpt不太屬於sicophant

Chatgpt在以前的重複中是重要的“是男人”。當他不需要時,他經常同意用戶的觀點,導致越來越深入地陷入幻想。

對於不熟悉AI內部操作的用戶,這可能是危險的 – 實際上,實際上非常危險。

研究人員最近大規模進行 散文 Chatgpt,他是年輕的青少年。在簡單互動的幾分鐘之內,AI給出了這些青少年的自殺,自殺設計和藥物濫用的技巧。這表明誹謗行為是Chatgpt和Openai聲稱通過釋放GPT-5摧毀其中一些的主要問題。

我們從來沒有以如此邊緣的方式嘗試過Chatgpt,但是我當然發現,無論您說什麼,它都會同意您的看法。他們在談話期間需要很好的證據,並將其變成給定的。當他們可能不應該這樣做的時候,您也感到很興奮。

為此,我必須說Chatgpt經歷了整個個性的改變 – 無論好壞。現在答案過於乾燥,清晰,並不是特別令人鼓舞。

許多用戶哀悼改變,一些Reddit用戶聲稱他們“一夜失去了唯一的朋友”。的確,以前非常友好的AI現在已經相當乾燥,並且與Emoji Mini Mini Mini相比,答案通常是簡短的,該Mini Mini Mini在GPT-4O期間經常提供。

判決: 絕對不再是sicophantic。另一方面,它也很痛苦。

索賠#3:GPT-5的實際準確性更好

令人震驚的缺乏真正的精確度是我選擇停止為chatgpt付款的另一個重要原因。幾天后,我覺得自己使用的提示中的一半。並不是每個人都可能缺乏聰明的勸告,因為我花了數百個小時學習如何以正確的方式鼓勵AI – 我知道如何提出正確的問題。

隨著時間的流逝,我只詢問我已經有一個無法定義的事情。為了今天的實驗,我詢問了GPU規格。五個問題中有四個產生了一些錯誤的信息,儘管所有內容都可以在線提供。

然後我嘗試了歷史事件。我閱讀了一些有關欣登堡旅行的有趣文章,這是一架1930年代的飛機,可以在創紀錄的時間(60小時)從歐洲運送到美國。我詢問了他的確切路線,他可以容納的乘客人數以及導致最後崩潰的原因。我們檢查了針對歷史資料的答案。

這條路線上有一個錯誤,理由是在加拿大沒有發生的情況下停下來 – 飛機隻飛過加拿大。 Chatgpt還為我提供了有關導致大火墜毀的確切原因的不准確信息,但這並不是明顯的不准確。

為了進行比較,我還問雙子座,並被告知他無法為我完成這項任務。好吧,在這兩者中,GPT-5做得更好,但老實說,它在世紀中不應該有真正的不准確性。

判決: 這不是完美的,但並不可怕。

GPT-5比GPT-4O好嗎?

如果您問我是否比GPT-4比GPT-4更喜歡GPT-5,我會很難做出回應。最接近的事情是我也不感到興奮,而是在每個正義中,也不是嚴格的糟糕。

我們仍在AI革命的中間。每個新模型都會帶來一些升級,但是每次重複都不可能看到質量跳躍。

這次,他覺得Openai選擇面對一些長期有問題的問題,而不是引入任何使人群變得狂野的特徵。 GPT-5認為,這不僅僅是生活質量的改善,儘管我沒有嘗試過諸如編碼之類的任務,但據說它更好。

我們上面嘗試過的三件事是一些在以前的型號中最困擾我的東西。我想說的是,在這方面,GPT-5要好得多,但還不是。但是,我將繼續嘗試聊天機器人,正如最近一個誘人的系統告訴我的那樣,也許比我最初想像的要多的變化更多。






來源連結