Openai發布了新的開放式重量模型 GPT-soss 可以免費上傳,調整甚至運行到筆記本電腦。
該模型有兩個變體:1,200億和200億個參數。最大的版本可以在單個NVIDIA GPU中執行,並執行類似於OpenAI現有的O4-Mini型號,而最小版本的性能類似於O3-Mini,並且僅以16GB的存儲器運行。目前,這兩種模型均通過Apache 2.0許可下的擁抱面,數據映,Azure和AWS等平台發布,這使它們可以用於商業目的進行廣泛修改。
這是Openai在Chatgpt首次亮相之前六年來的第一個開放式體重模型。直到今年,首席執行官山姆·奧特曼(Sam Altman)報告擔心擔心是不發布跟進的主要原因。同時,由於開發人員的成本較低和適應性,開發人員正在湧向開放模型。一月份,迪索克(Deepseek)興起,奧特曼(Altman) 他們說 Openai“在故事的錯誤方面”,而沒有發布自己的開放模型。
現在,OpenAI通過開放的權重模型確認自己可以執行推理,瀏覽網絡,編寫代碼並通過公司現有的API操作。 “我認為很多人真的很驚訝地知道,我們的絕大多數客戶已經在使用許多開放式模型,”媒體更新期間,研究員Openai說。 “我們想連接這一差距,並允許他們在整個船上使用我們的技術。”
Openai在安全方面表示,GPT-Russ是迄今為止最嚴格測試的模型,並且已經經過外部安全公司進行了測試,以確保它不會在網絡空間和生物武器等領域提高風險。根據公司的新聞稿,該模型的思維鍊或用於獲得答案的可見程序似乎“監控不良行為,欺騙和虐待”。它的退出僅適用於文本,就像OpenAI的所有模型一樣,GPT-Russ培訓數據也沒有披露。
“團隊真的在用它做飯。”
與GPT-Russ相比,OpenAI與其他開放型型號(例如Llama,DeepSeek或Google的Gemma)相比尚未共享參考點。 GPT-Russ的兩種變體都在編碼任務和測試(例如對人類的最新檢查)中執行類似於OpenAI封閉模型。 Openai Greg Brockman的共同創始人說:“這些都是令人難以置信的模型。” “團隊真的在用它做飯。”
OpenAI並不致力於GPT-Russ發布程序,但希望該模型將由較小的開發人員和公司使用,這些開發人員和公司希望更多地控制其數據的使用方式。布羅克曼說:“我一直相信,如果您減少了進入的障礙,那麼創新就在上升。” “你讓人們擊中,然後他們會做令人難以置信的驚人的事情。”