Openai在周二宣布,在O.中發布了兩種具有相似功能的開放式體重原理模型。 擁抱該公司說,當在各種參考點測量以比較開放模型時,將模型描述為“最先進”。

這些型號有兩種尺寸:更大,功能更強大的GPT-US-20B模型,該模型可以在單個GPU NVIDIA上運行,而較輕的GPT-US-20B模型可以在16GB的存儲器筆記本電腦上運行。

Openai於五年前發布的GPT-2的首個“開放”語言模型。

Openai在更新中表示,正如TechCrunch之前提到的那樣,其開放模型將能夠向雲中的AI模型發送複雜的問題。這意味著,如果OpenAI Open模型無法執行特定任務,例如編輯圖像,則開發人員可以將Open Model連接到公司最強大的封閉模型之一。

儘管Openai Openai AI在其早期模型,但該公司通常贊成一種私有的封閉源開發方法。最新的策略幫助Openai創建了一家大型企業,該企業通過API向企業和開發人員出售了AI模型的訪問權限。

但是,首席執行官山姆·阿爾特曼(Sam Altman)在一月份表示,他認為當它即將開放他的技術供應時,Openai是“歷史上的錯誤方面”。該公司目前正面臨著AI中國實驗室的壓力,包括DeepSeek,Alibaba Qwen和Moonshot AI,它們已經開發了世界上許多最有能力,最受歡迎的開放模型。 (儘管Meta統治了開放的AI空間,但該公司的Llama AI模型在去年已經倒退了。)

7月,特朗普政府還敦促我們AI開發人員開放更多的技術,以促進AI的全球採用美國價值。

TechCrunch活動

弗朗西斯科
|
2025年10月27日至29日

隨著GPT-Russ的解放,Openai希望能夠與開發商和特朗普的政府屈服,他們都在看著AI中國實驗室在開源區域攀升。

Openai Sam Altman的首席執行官在與TechCrunch分享的一份聲明中說:“ Openai的任務在2015年開始時,Openai的任務是確保AGI受益。” “為此,我們很高興世界基於在美國創建的一大堆AI,基於民主價值觀,免費提供給所有人並獲得廣泛的利益。”

(tomohiro ohsumi/getty圖片攝圖片來源:tomohiro ohsumi / getty圖像

模型如何執行

Openai打算在其他AI模型中建立領導者的開放模型,該公司聲稱已經做到了這一點。

在CodeForces(帶有工具),競爭性編碼測試,GPT-US-20B和GPT-US-20B 2622和2516等級中,均超過了DeepSeek R1,同時降低O3和O4-Mini。

OpenAI Open模型在CodeForces中的性能(信用:OpenAI)。

關於對人類的最新檢查,一個難題測試來自許多問題(使用工具),GPT-US-20B和GPT-Thessaloniki分別為19%和17.3%。同樣,這會降低O3,但超過了DeepSeek和Qwen的頂級模型。

Openai在HLE中的開放模型性能(信用:OpenAi)。

具體而言,OpenAI的開放模型比最新的AI,O3和O4-MINI邏輯模型的放棄大大更大。

在OpenAI的最新AI邏輯模型中,Halfuses變得越來越嚴重,該公司此前曾表示,它不夠理解原因。 Openai在白皮書中說,這是“預期的,因為較小的模型在全球知識的知識少於更大的邊界模型,並且傾向於付費更多”。

Openai發現,GPT-US-20B和GPT-US-20B是為了響應49%和53%的PersonQA問題,這是該公司的內部參考,以衡量模型對人員知識的準確性。這比O1的O1模型的三重錯覺率高出16%和高於O4-Mini模型,該模型得分為36%。

培訓新模型

Openai表示,其開放型模型接受了具有私人模型的類似過程中的培訓。該公司表示,每個開放模型都利用物種(MOE)的混合物來擊中任何給定問題的參數,從而更有效。對於擁有170億個總參數的GPT-US-20B,OpenAI指出,該模型僅激活每個謹慎的51億參數。

該公司還指出,其開放模型已通過使用高端使用(RL)學習學習A的培訓 – 培訓後,使用NVIDIA GPU的大型群集在模擬環境中教授AI模型。這也用於培訓OpenAI模型,開放模型具有類似的思維鏈,他們需要額外的時間併計算資源來通過答案進行工作。

由於培訓後的過程,OpenAI指出,開放AI模型在AI代理上脫穎而出,並且能夠在思維鏈過程的一部分中調用諸如組織搜索或Python代碼之類的工具。但是,Openai表示,其開放模型僅用於文本,這意味著它們將無法處理或製作圖像和聽起來像公司的其他型號。

OpenAi在Apache 2.0下釋放GPT-US-20B和GPT-US-20B,通常被認為是最允許的之一。該許可將允許企業從OpenAI Open模型中產生收入,而無需支付或獲得公司許可。

但是,與AI -Labs(例如AI2)的完全開源報價不同,OpenAI表示不會釋放用於創建開放模型的培訓數據。這一決定並不奇怪,因為包括OpenAI在內的幾項針對AI模型的主動訴訟聲稱這些公司在受版權保護的項目中不適合AI模型。

Openai在近幾個月來延遲了幾次開放模型的發布,部分目的是解決安全問題。除了公司的標準安全政策外,Openai告訴白人聖經,他還調查了壞演員是否可以協調GPT-Thessaloniki模型在網絡空間或生物學或化學武器中更有用。

在OpenAI和第三方評估人員的測試之後,該公司表示,GPT-Russ可以略微提高生物學能力。但是,他沒有找到證據表明這些開放模型可以達到這些領域的風險“高容量”的門檻,即使在完美之後。

儘管OpenAI模型似乎是開放模型之間的最新模型,但開發人員急切地等待DeepSeek R2的發布,DeepSeek R2(下一個AI邏輯模型)以及新的超級智能實驗室的新開放模型。

來源連結