Sora橫空出世,“技驚四座”后,在AI領域一向野心勃勃的特斯拉CEO埃隆·馬斯克(Elon Musk)“坐不住”了。
近日,馬斯克在社交媒體上多次發表觀點或回復評論,力證特斯拉在視頻生成上的實力。馬斯克表示:“特斯拉在大約一年前就能以精確的物理生成真實世界的視頻。只不過,由于訓練數據來自汽車,生成的視頻并不有趣。這些視頻看起來像特斯拉的普通視頻,實際上是通過動態生成的。”
馬斯克同時透露,由于FSD(FullSelf-Drive,完全自動駕駛系統)訓練算力不足,因此沒有使用其他視頻進行訓練,但這是可行的。年內晚些時候,當特斯拉有空余算力時,就會繼續訓練。
馬斯克狂秀“肌肉”
日前,馬斯克發布了特斯拉一年前模擬真實場景的自動駕駛視頻,并稱“特斯拉視頻的生成能力超越了OpenAI,它可以預測到極其準確的物理特性,這對自動駕駛至關重要”。
有網友看完視頻后稱,特斯拉應該制作視頻游戲。馬斯克對此回復道:“我早就想這么做了,只不過想要制作游戲,還需在特斯拉推出FSD之后才可以。”
在自動駕駛路線選擇上,馬斯克一直堅定押注“純視覺路線”,即不依靠雷達等傳感器,僅通過車載智能攝像頭作為傳感器輸入,經過特定算法的計算和處理,對車輛周圍的環境信息做出精確感知,從而實現自動駕駛功能的一種技術方案。
馬斯克認為,純視覺路線才是最佳解決方案,因為人類開車時只采集視覺數據,所以機器開車也應該如此。2021年1月,馬斯克宣布:“從今往后去除雷達,這根拐棍太糟糕了,我沒開玩笑。顯然,開車只用攝像頭的效果很好。”
2023年11月,特斯拉宣布已開始向員工推出FSD V12版本。中信證券分析稱,特斯拉依賴神經網絡的FSD V12為自動駕駛提供了一套未經證明的新路徑,若得以走通,將對行業產生較大顛覆;FSD V12有望打造自動駕駛領域的基礎底座,引領視覺(算法)的GPT時刻。
在最新一次財報電話會上,馬斯克曾表示,特斯拉在人工智能效率方面遠遠領先于世界上任何其他公司。“事實上,我認為很多汽車公司都應該主動尋求FSD授權。我們已經進行了一些初步的對話,但我覺得他們似乎還不相信這是真的。不過,今年應該會變得很明顯。我想強調的是,如果我是另一家汽車公司的CEO,我肯定會聯系特斯拉,要求授權FSD技術。這絕對是明智之舉。”
自動駕駛迎來新機遇
除了顛覆影視業,Sora或在自動駕駛上大有可為。360集團創始人、董事長周鴻祎說,“這次OpenAI利用它的大語言模型優勢,讓Sora實現了對現實世界的理解和對世界的模擬兩層能力,這樣產生的視頻才是真實的,才能跳出2D的范圍模擬真實的物理世界。”
周鴻祎認為,有強勁的大模型做底子,基于對人類語言的理解,對人類知識和世界模型的了解,再疊加很多其他的技術,就可以創造各個領域的超級工具。比如生物醫學、蛋白質和基因研究,包括物理、化學、數學的學科研究上,大模型都會發揮作用。這次Sora對物理世界的模擬,至少將會對機器人具身智能和自動駕駛帶來巨大的影響。
周鴻祎稱:“原來的自動駕駛技術過度強調感知層面,而沒有工作在認知層面。其實人在駕駛汽車的時候,很多判斷是基于對這個世界的理解。比如對方的速度怎么樣、能否發生碰撞、碰撞嚴重性如何。如果沒有對世界的理解就很難做出一個真正的無人駕駛。所以這次Sora只是小試牛刀,它展現的不僅僅是一個視頻制作的能力,它展現的是大模型對真實世界有了理解和模擬之后,會帶來新的成果和突破。”
中信證券在研報中稱,在技術上Sora采用了Diffusion Transformer的路線,OpenAI表示Sora在訓練過程中表現出了與其他模型不同的涌現能力,通過涌現學習到了物品的時間與空間相關性以及與周圍世界的互動能力等等。得益于這種基于規模的涌現能力,如果后續持續擴大模型以及訓練集的規模,那么將來以Sora為基礎的模型可能做到模擬整個物理和數字世界,成為真正的“世界模型”。
中信證券認為,長期以來,計算機視覺領域的研究一直過于碎片化,直到目前實際用例中的計算機視覺模型仍根據不同任務采取不同的小模型。而Sora的成功以及其背后展現出的涌現能力可能為計算機視覺領域的研究提供了一個明確的方向,成為未來視頻與模擬領域(例如自動駕駛)的統一范式。
本文鏈接:面對Sora,馬斯克“坐不住”了http://m.lensthegame.com/show-2-2919-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。