BAL數據集。從左到右:10155、934和392腔室。信用: arxiv (2025)。 doi:10.48550/arxiv.2502.04640
想像一下,您正在嘗試使用僅從不同方面拍攝的照片來製作建築物的確切三維模型,但是您不確定所有攝像頭在哪里以及多遠。我們的大腦大腦可以填補許多這些細節,但是計算機很難做到這一點。
這種情況是機器人的計算機系統和導航系統中的一個眾所周知的問題。例如,機器人應獲得許多2D信息,並製作三維點雲 – 三維空間中數據點的娛樂 – 以順序解釋場景。但是,此過程中涉及的數學是複雜的,並且會遇到錯誤,以及許多錯誤評估距離的方法。它也很慢,因為它迫使計算機用一件件創建3D標籤的雲。
哈佛大學約翰·A·波森(SEA)的工程學和應用科學學院的計算機科學家認為,它們具有最佳方法:一種突破性算法,允許計算機重建來自2D圖像的高質量3D場景的速度比現有方法快得多。
他們的研究在 紙“用凸優化的羅馬建造”,最近獲得了記憶中最佳系統紙張獎 機器人技術:科學與系統會議該領域是由海上電氣工程系的助理教授Haoi Khan和Heng Yang撰寫的。結論已在 arxiv 預印服務器。
汗說:“將AI深度深度的現代預測與凸數值優化的新方法相結合,該方法可以同時評估場景中所有點的位置,而無需分步猜測。” “因此,重建過程不僅比傳統方法更快,更可靠,而且還不需要從計算機上進行初始假設。”
更多信息:
Haoyu Han等人,以凸優化的羅馬建造, arxiv (2025)。 doi:10.48550/arxiv.2502.04640
引用:計算機從2D照片中重建3D環境一部分時間(2025年8月6日)。 2025年8月6日從https://techxplore.com/news/2025-08-Reconstruct-3d-environments-2d-photos.html收到
該文檔具有版權。除了出於私人研究或研究目的的一些公平交易外,如果沒有書面解決方案,就無法再現。內容僅用於信息目的。