預測一個複雜的系統——例如氣候網絡、經濟,甚至人類的心臟——何時處於即將崩潰的邊緣,長期以來一直是科學上最困難的挑戰之一。這些所謂的關鍵轉變——系統穩定狀態之間的突然轉變,例如從健康的生態系統到崩潰的生態系統——可能會導致快速且不可逆轉的變化,從生態崩潰到癲癇發作,而沒有明確的警告。由昆明理工大學的馬志勤博士和曾春華教授領導的一項新研究,與華北大學的張一成教授和麥吉爾大學的托馬斯·伯里博士合作,提出了一種利用機器學習來檢測這種轉變的早期跡象的突破性方法。他們的工作發表在《通信物理學》上,描述了一種特定於系統的方法,該方法可以從歷史數據中學習,比以前的通用模型更準確地預測轉折點。
關鍵的轉變無處不在——無論是珊瑚礁突然白化、金融市場崩潰還是心律失常的發作。以前的預測方法依賴於通用信號,例如方差增長(衡量數據隨時間波動的程度)或滯後自相關(衡量系統與其最近的相似程度)。兩者都來自動力系統理論,即係統如何隨時間演變的研究。然而,當應用於嘈雜的現實世界數據集時,這些指標常常失敗。正如馬博士所解釋的,“如果時間序列太短、噪聲太大或太平穩,或者轉變不是對應於局部分叉而是全局分叉,或者根本沒有分叉,那麼一般預警信號可能無法發出轉變信號。”分叉是指系統行為的突然變化,例如當條件發生變化時,一條河流突然分成兩條支流。為了克服這些限制,該團隊使用替代數據(人工創建的數據集,在統計上與真實數據相似)訓練機器學習模型,使模型能夠學習獨特的、特定於系統的行為,而不依賴於限制性的理論假設。
馬博士和她的同事開發了一種稱為基於替代數據的機器學習的新框架,該框架通過複製歷史事件中發現的統計模式來生成大量訓練數據。他們的方法在各種現實世界的例子中進行了測試,包括缺氧的海洋沉積物、古代人類社會和生物心律。與方差和自相關等傳統指標相比,基於替代數據的機器學習始終表現出更高的靈敏度,這意味著它可以準確地檢測真實的警告和更高的特異性,從而避免誤報。簡而言之,它檢測真實信號,同時最大限度地減少錯誤。
這些模型使用不同類型的機器學習系統進行了測試,包括識別基於空間和時間的模式的捲積神經網絡;長短期記憶網絡,識別數據中的遠程連接;支持向量機,通過尋找最佳劃分邊界將信息劃分為不同的類別。這些算法取得了出色的性能分數(準確性和精確度的綜合統計衡量標準),在某些情況下接近完美。
該團隊分析了現實世界中快速轉變的例子。在地中海的沉積物岩心中,他們發現了氧氣水平下降的反复事件,這些事件歷史上與海洋缺氧有關,海水中氧氣的完全喪失可能導致大規模滅絕。基於代理數據的機器學習模型,經過對早期轉變的訓練,已經成功地預測了後來的轉變。同樣,當應用於南極洲的冰芯數據時,該方法預測了結束冰河時代的突然溫度變化。他還發現了前西班牙裔普韋布洛社會的文化轉折點,其中建築活動的記錄顯示,社會崩潰之前會出現嚴重的減速,這意味著在完全崩潰之前逐漸喪失復原力,並且從輕微干擾中恢復的時間更長。
性能評估表明,在大多數情況下,基於代理數據的機器學習優於標準技術,特別是在轉換不遵循經典分叉模式的情況下。正如馬博士所指出的,“我們的方法不像以前的方法那樣受到局部分岔的限制性假設的限制。通過直接從過去的轉移數據中學習,它可以適應它所預測的現實世界系統。”該研究進一步表明,基於代理數據的機器學習分類器在多種代理生成技術中保持了魯棒性,包括調幅傅立葉變換,這是一種數學方法,可以創建新數據,同時保留原始時間序列的整體變異性和結構。該團隊還使用迭代算法來保留基於時間的數據中的複雜屬性,以提高準確性。
除了環境和生物系統之外,這種方法還可以改變經濟、能源網絡和公共衛生領域的風險預測。許多災難性事件,例如金融崩潰或電網中斷,都是由相互交織的動態產生的,這些動態違背了簡單的數學模型。通過識別系統特定數據中的警告信號,基於代理數據的機器學習可以提供關鍵的時間來減輕或防止崩潰。馬博士說:“根據過去轉變的豐富替代數據進行訓練的機器學習分類器對於提高我們準備或避免關鍵轉變的能力至關重要。”他強調該方法補充而不是取代現有的預警工具。
馬博士和她的團隊指出,未來的發展將集中於完善模型如何解釋不同的轉型距離,將分類轉變為更加連續和動態的風險衡量標準。他們相信,隨著更多高質量的時間序列數據(定期收集的長期測量數據)的出現,基於替代數據的機器學習框架將繼續發展,提供一種強大而統一的方法來理解從自然生態系統到全球經濟等系統的穩定性和彈性。
歷史數據建模和人工智能的這種創新融合標誌著朝著預測不可預測的事情邁出了重要一步。通過對過去危機的迴聲進行訓練,基於替代數據的機器學習為預測(甚至可能預防)自然或社會的下一個重大轉折點鋪平了道路。
期刊參考文獻
Mazhiqin、Zeng Chunhua、Zhang Yi-Cheng 和 Bury Thomas M.“利用歷史數據替代品訓練的機器學習來預測關鍵轉變”。 通信物理學 (2025)。數字編號: https://doi.org/10.1038/s42005-025-02172-4
關於作者
馬志勤博士 擁有中國昆明昆明理工大學物理學學士學位和系統科學博士學位。他的研究重點是統計物理和復雜系統、預警信號檢測和分析以及機器學習在復雜系統中的應用。馬博士採用跨學科方法,結合物理、數學和計算機科學來揭示臨界點附近系統動態演化的普遍規律。他的研究成果發表在《物理通訊》、《物理評論研究》和《歐洲物理學快報》等多家期刊上。

曾春華教授 主要從事統計物理和復雜系統研究。在Natil等期刊發表SCI論文120餘篇。科學。牧師,通訊員。物理,物理。牧師 B,物理學。修訂研究和物理學。修訂版E。

張義成博士 是瑞士弗里堡大學物理學高級教授,也是歐洲科學院院士。他獲得了西薩的里雅斯特大學和拉薩皮恩扎大學的博士學位。他的研究領域包括大數據、人工智能、複雜網絡、信息經濟學、網絡物理系統、統計物理學、複雜性科學和金融。他因開創性貢獻而受到廣泛認可,包括共同開發了卡達爾-帕里西-張 (KPZ) 方程(他的導師喬治·帕里西因此獲得了 2021 年諾貝爾物理學獎)以及將少數博弈模型引入經濟物理學。他最近的工作重點是下一代人工智能助手的理論基礎。他在《美國國家科學院院刊》(PNAS)、《物理報告》和《物理評論快報》等國際期刊上發表了 250 多篇學術論文,總引用次數超過 31,000 次。

托馬斯·伯里博士 從事機器學習和非線性動力學交叉領域的研究。他有興趣為各種複雜系統開發臨界點預警信號。他擁有滑鐵盧大學應用數學博士學位,並在《PNAS》和《Nature Communications》等期刊上發表了他的研究成果。










