巴比特资讯
|2023-06-18 17:25
有沒有那麼一瞬間,你認為我們生活的世界,就是模擬的矩陣世界?
尼奧在「黑客帝國」中發現自己生活的世界並非真實存在,而是被精心設計的模擬現實。
而你,有沒有那麼一瞬間,認為我們生活的世界,就是模擬的矩陣世界。 靜心感受,這個人類生存已久的地球,大自然的一切,都是虛幻世界。 北極冰川太陽升起。海底世界中的千奇百怪的魚群、五彩斑斕的珊瑚礁。 高山飛雪,老鷹在浩瀚無垠的天空中翱翔。熾熱沙漠,凶險的蛇自由穿梭。 清澈見底的大海和小溪,海龜在沙灘慵懶地曬著太陽,許多蜻蜓在空中嬉戲。 嘩嘩墜落的雨滴、隨風飄落的楓葉,時間瞬間戛然而止。 你所見皆是人工智能設計的。它們的模擬是如此逼真,甚至被所有人誤認為是現實本身。 打開這扇矩陣大門的團隊來自普林斯頓,研究一出瞬間在網上瞬間引起軒然大波。 論文中,研究人員引入了一個自然世界的逼真3D場景程序生成器「Infinigen」。 Infinigen完全是程序化的,從形狀到紋理,都是通過隨機的數學規則從頭開始生成。 甚至,還能變換無窮,覆蓋了大自然界的植物、動物、地形,還有火、雲、雨和雪等自然現象。 論文地址:https://arxiv.org/pdf/2306.09310.pdf Infinigen建立在免費和開源的圖形工具Blender上,同樣Infinigen也是開源的。 值得一提的是,3.5個小時就能生成一對1080p的圖像!
普林斯頓大學提出的Infinigen可以輕鬆定制,生成各種特定任務的真實情況。 而它最主要的作用就在於,能夠作為作為無限訓練數據的生成器,用於廣泛的計算機視覺任務。 其中,包括目標檢測、語義分割、姿態估計、3D重建、視圖合成和視頻生成。 此外,它還可以用於構建訓練物理機器人,以及虛擬具身智能體的模擬環境。 當然了,3D打印、遊戲開發、虛擬現實、電影製作和一般的內容創作都可用。 接下來,看看Infinigen系統是如何被設計出來的。 研究人員主要使用Blender開發程序化規則,Blender是一個開源的三維建模軟件,提供各種基元和實用工具。 而用戶通過轉換對象、添加基元和編輯網格來修改這一表示。 Blender提供了大多數常見3D文件格式的導入/導出。 最後,Blender中的所有操作都可以通過其Python API自動完成,或者通過檢查其開源代碼。 作為Infinigen的一部分,研究人員開發了一套新的工具來加速研究人員的程序化建模。 一個值得注意的例子是研究人員的節點轉換器,它可以自動將節點圖轉換為Python代碼,如圖所示。 由此產生的代碼更加通用,並允許研究人員隨機化圖形結構,而不僅僅是輸入參數。 這個工具使結點圖更具表現力,並允許與其他直接用Python或C++開發的程序化規則輕鬆整合。 它還允許非程序員通過製作節點圖為Infinigen貢獻Python代碼。 生成器子系統。 Infinigen是由生成器組成的,生成器是概率程序,每個程序都專門用於生成一個子類的資產(如山或魚)。 每個發生器都有一套高級參數(如山的整體高度),反映了用戶可控制的外部自由度。 在默認情況下,研究人員根據為反映自然界而調整的分佈對這些參數進行隨機抽樣,沒有用戶的輸入。 然而,用戶也可以使用研究人員的Python API覆蓋任何參數,以實現對數據生成的細粒度控制。 下圖是隨機的、且僅包含地形的場景。研究人員為各種自然場景類型選擇了13張圖片。 分別為:山脈、上漲的河水、雪山、海岸日出、水下、北極冰山、沙漠、洞穴、峽谷和浮島。 下圖則是隨機生成的模擬火焰的圖片,包括煙霧、瀑布,以及火山噴發的場景。 研究人員自動生成了不同基因組(a)、身體部位(b)、身體部位拼接(c)、毛髮(d)和體態(e)。 圖片右側則是研究人員展示的隨機生成的食肉動物、食草動物、鳥類、甲蟲和魚類。 在下圖中,研究人員按程序組成一個隨機的場景佈局(a)。 研究者生成所有必要的圖片內容(b,用來顯示每個網格面的顏色),並應用程序化材料和位移(c)。 研究人員展示了三個相機距離不同,但內容相同的特寫網格可視化視圖。 儘管網格分辨率不同,但在最終的圖像中看不到任何變化。
為了對Infinigen進行評估,研究人員製作了30K的圖像對,這些圖像有用於矯正立體匹配的地面實景。 研究人員在這些圖像上開始訓練RAFTStereo,並在Middlebury驗證集和測試集上對結果進行了比較。
英偉達科學家Jim Fan表示,當我們在現實中沒有好的訓練數據時,模擬是便下一個「金礦」。 這裡,Infinigen便是一個開源的、程序化生成的、用於3D視覺的逼真數據集。其質量是驚人的!沒有兩個世界是相同的。 ▸ 每一個小細節都是隨機和可定制的,甚至是花瓣上的褶皺! ▸ 自然界的各種物體和場景:植物、動物、地形;火、雲、雨和雪。 ▸ 基準真實值自動註釋:光流、三維場景流、深度、表面法向量、全景分割、封閉邊界。 有網友表示,這真是讓我大開眼界。在Blender中程序化生成3D世界。不使用AI,就可以創建任何你能想像的世界。 結合像這樣的工具來創造世界,像Daz3D這樣的工具來創造角色,Blockade Labs來創造天空盒,Convai來創造NPC。 還有人表示Infinigen將在人工智能計算機視覺研究中發揮作用。 比如,我們想在一個有霧的森林裡面做一個有瀑布的村莊。 我們告訴一個人工智能寫一個關於森林的詳細描述,再發送到3D世界生成器。 世界生成後,就可以在村莊里添加人物角色。這些人將由人工智能控制,他們將有互動、對話和記憶。 另外,有網友稱程序生成已經存在了20年(我已經做了15年)。 「No Man's SKy」是5年前技術的一個很好的例子。 Infinigen的亮點在於它生成標記數據。這些數據可用於訓練AI。這就很瘋狂。 還有網友暢想,在不遠的將來,遊戲會變得瘋狂……「獨立」遊戲開發者將能夠推出一些瘋狂的高端內容。 Infinigen生成太過逼真,以至於有人認為這是虛幻引擎生成的。
Alexander Raistrick是普林斯頓大學計算機系的二年級博士生,導師是Jia Deng 。 Lahav Lipson是普林斯頓大學三年級博士生。 他研究重點是為三維視覺構建深度網絡,利用關於極線幾何的強大假設來實現更好的泛化和測試準確性。 Zeyu Ma是普林斯頓大學視覺與學習實驗室的三年級博士研究生。他曾於2020年獲得清華大學電子工程學士學位。目前的研究重點是多視圖3D重建和程序數據生成。 https://infinigen.org/
https://twitter.com/DrJim Fan/status/1670098819026128897
在AIGC浪潮下,
細分領域面臨哪些潛在風險和機遇,
該如何抓住這個新變革的機會?
這是一個匯聚思想智慧,
交流經驗技能的盛會,
同時也是一場AIGC工具應用的深度培訓會,
你怎能錯過?
↓↓↓
中文推特: https://twitter.com/8BTC_OFFICIAL
英文推特:https://twitter.com/btcinchina Discord社區:https://discord.gg/defidao電報頻道:https://t.me/Mute_8btc電報社區:https://t.me/news_8btc
作者 :巴比特资讯
本記事はPANewsに登録したコラムニストの見解であり、PANewsの立場を代表しないため、法的責任を負いません。記事および意見は投資アドバイスにもなりません。
画像ソース :
巴比特资讯
著作権侵害がある場合は、作者までご連絡ください。