通過擴散擴散擴散橋模型模型修改的設計模型模型使用了兩個目標函數,先於損失並比較損失以降低計算成本並防止經驗。學分:東京科學研究所
科學的研究人員開發了生成擴散模型的新結構,該結構顯著改善了人工智能的生成模型。該方法已重新考慮了Sherining Bridge的模型作為具有無限許多隱藏變量的變異自動代碼,從而降低了計算成本並防止重新思考。通過中斷編碼器的製備,這種方法可以開發更有效的生成AI,並具有廣泛的適用性,並且在標準擴散模型之外進行了廣泛的適用性。
擴散模型是生成AI中最廣泛使用的方法之一,用於創建圖像和音頻。這些模型生成新數據,逐漸向真實樣本添加噪聲(顏色),然後研究如何將此過程(DEN形成)變成現實數據。廣泛使用的版本是基於點的模型,它是由於擴散過程而達到的,並以足夠長的間隔連接到數據。但是,這種方法具有限制,即當數據與前一個方法完全不同時,台落和enoing過程的臨時間隔更長,這會導致樣本生成的放緩。
現在,來自日本東京科學研究所的研究小組提出了擴散模型的新基礎,該模型更快且苛刻。他們已經到達了,重新思考 Schrödinger橋模型(SB)擴散模型的類型,作為變異自動-Ecodora(VAE)。
這項研究是由Khantaro Kaba的一名研究生和東京科學物理學院的Masayuki Oodki教授進行的,與Sugiyama先生(當時的研究生)和Sugiyama助理教授合作,來自日本Tokhoku,日本Tokhoku,sugiyama的助理教授。他們的結論發表在 物理評論的研究 2025年9月3日。
SB模型比基於點的標準點具有更大的靈活性,因為它們可以在最後一次使用隨機微分方程(SDE)連接任何兩個概率分佈。這支持更複雜的成本和更好的樣本生成。然而,折衷方案在於SB模型在數學上是複雜且培訓昂貴的事實。
提出的方法通過將SB模型重新設計為具有幾個隱藏變量的VAE來考慮這一點。 Kaba說:“使用數據處理的不平等,這種觀點可以將隱藏變量的數量從一個擴展到無限。這種觀點使我們能夠解釋VAE內的SB類型的模型。”
在這種情況下,編碼器是一個直接的過程,它將真實數據顯示為嘈雜的隱藏空間,而解碼器則將重新構造的過程轉換為逼真的樣品的重建過程,並且兩個過程均被神經網絡研究的SDE建模。
該模型使用兩個組件學習的目的。第一個是以前的損失,該損失可以保證代碼可以正確地顯示具有先前分佈的數據分配。第二個是漂移的比較,它教導解碼器模仿反向編碼器過程的動力學。此外,在先前的損失穩定後,可以在早期階段停止編碼器的訓練。這使我們能夠快速完成培訓,從而降低了殘留物的風險並保持SB模型中的高精度。
“目標函數由與損失和漂移相對應的先前部分組成,該部分分別表徵了編碼器和解碼器中神經網絡的訓練。它們共同降低了SB類型培訓模型的計算成本。這證明了編碼器的中斷訓練的中斷會使Reassignment的問題軟化,” Drevki解釋說。 ”
這種方法是靈活的,可以應用於其他概率集規則集,甚至不是馬爾可夫流程,這使其成為廣泛適用的學習方案。
更多信息:
肯塔羅·卡巴(Kentaro Kaba)等,橋橋的擴散擴散模型作為擴展 物理評論的研究 (2025)。 doi:10.1103/dxp7-4hby
引用:擴散模型中編碼器訓練的中斷提供了更有效的生成AI(2025年9月29日)。 2025年9月29日從https://techxplore.com/news/2025-09-Encoder-diffusion-enables-ex-generative.html收到
該文檔具有版權。除了出於私人研究或研究目的的一些公平交易外,如果沒有書面解決方案,就無法再現。內容僅用於信息目的。