金磊 發自 凹非寺
量子位 | 公眾號 QbitAI
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
家人們,我們先來看一段視頻,你能否發現其中有什么異樣?gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
如果說,在這段視頻里,有一個物件是假的,是被合成進去的,你能發現嗎?gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
不賣關子,現在就來揭曉答案。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
“造假”的物體,正是這個出現在不該出現位置的紅綠燈。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
我們再來玩一把“大家來找茬”,請看題目:gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
答案是:放在置物架上的這個設備。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
這就是來自小鵬汽車最新的一項研究——Anything in Any Scene。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
主打一個往真實環境里毫無違和感地“塞”進去任何東西。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
并且研究團隊給予這個通用框架的評價是:gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
它的應用遠遠超出了視頻數據增強的范圍,在虛擬現實、視頻編輯和其他各種以視頻為中心的應用中顯示出巨大的潛力。
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
甚至有網友在看完效果之后直呼:gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
再見了視頻證據~這個技術插入視頻的物體可以保持與原始素材相同的真實感。
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
那么這項AI技術更多效果如何,我們繼續往下看。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
Anything in Any ScenegsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
先從室外場景來看下效果。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
在視頻中合成某個物體的時候,往往不逼真的原因,可以總結為位置放置錯誤、無陰影、無HDR和無樣式遷移等原因。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
正如下面幾個錯誤案例所示:gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
而小鵬團隊的效果,是這樣的:gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
相比剛才缺少各種因素的情況而言,效果顯然是相對逼真的。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
再與其它已有的算法和框架做比較,例如DoveNet、StyTR2和PHDiffusion,它們在室外場景中合成物體的效果是這樣的:gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
小鵬的Anything in Any Scene從效果上來看,依舊是相對更為逼真。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
同樣的,在室內環境中,不論是包包還是鞋子,小鵬新AI技術所生成的效果可以說是真假難辨的那種了。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
更多的效果展示如下圖所示:gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
除了視覺效果之外,小鵬團隊在CODA數據集的原始圖像上,將訓練的YOLOX模型的性能與Anything in Any Scene框架在原始和增強圖像的組合上訓練時的性能進行了比較。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
從整體精度上來看也有了不小的提高。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
怎么做到的?gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
從此次提出的框架上來看,Anything in Any Scene主要由三個關鍵部分組成。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
首先是物體放置和穩定化的過程。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
團隊先確定相機在場景中的世界坐標系位置,并將其作為物體插入的參考點;使用相機的內參矩陣和姿態(旋轉矩陣和位移向量)將世界坐標系中的點投影到像素坐標系中,以確定物體在視頻幀中的放置位置。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
為了避免與場景中其他物體的遮擋,團隊還使用語義分割模型估計每個幀的分割掩模,并確保物體放置在未被遮擋的區域。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
在物體穩定化方面,團隊在連續幀之間估計光流,以跟蹤物體的運動軌跡;并通過優化相機姿態(旋轉矩陣和位移向量),最小化物體在連續幀中的3D到2D投影誤差,確保物體在視頻中的穩定運動。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
其次,是光照估計和陰影生成。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
針對HDR全景圖像重建,團隊使用圖像修復網絡推斷全景視圖的光照分布,然后通過天空HDR重建網絡將全景圖像轉換為HDR圖像;并結合使用GAN訓練編碼器-解碼器網絡來模擬太陽和天空的亮度分布。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
在環境HDR圖像重建方面,研究人員則是收集了場景的多視角LDR圖像,并通過現有模型恢復為HDR圖像,以學習連續曝光值表示。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
在物體陰影生成上,團隊則是使用3D圖形應用(如Vulkan)和光線追蹤技術,根據估計的主要光源位置生成插入物體的陰影。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
最后的步驟,則是照片風格遷移。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
框架對插入物體的外觀進行微調,使其風格與背景視頻完美融合,進一步提升了視頻的逼真度。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
這便是小鵬Anything in Any Scene在真實環境中生成物體較為逼真的原因了。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
而與小鵬此次研究類似的效果,其實早在之前便有了許多工作。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
例如名為GAIA-1的多模態生成式世界模型,便可以從頭到腳的打造逼真的自動駕駛視頻:gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
這里的每一幀都是由AI生成,甚至就連不同的路況和天氣等等,都是可以做到以假亂真。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
就連LeCun看了都驚嘆不已:gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
不過這些AI效果雖真實,但也有網友提出了擔憂之處,那便是網上虛假、生成的信息越發的逼真;因此,以后辨別信息的真假需要更加警惕。gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
目前,這個項目已經在GitHub中開源,感興趣的小伙伴可以了解一下了~gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
參考鏈接:
[1]https://anythinginanyscene.github.io/
[2]https://arxiv.org/abs/2401.17509gsH流量資訊——探索最新科技、每天知道多一點LLSUM.COM
本文鏈接:小鵬數據造假「小鵬公然AI“造假”,嘖嘖嘖」http://m.lensthegame.com/show-3-9399-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 山東召開推動工業經濟頭號工程高質量發展大會、上海培育專精特新企業超1萬家……地方工信快報來了!
下一篇: 女子為買房假離婚 結局令她徹底傻眼...「女子為購買新房假離婚后人財兩空 丈夫已經有了新歡拒絕復婚」