2月15日,一手締造了ChatGPT的OpenAI再發“大招”,發布了其第一個文生視頻大模型Sora。在官方分享的演示視頻中,該模型可以根據用戶輸入的提示詞,生成長達一分鐘、連貫穩定的高清視頻。
雖然Sora還未獲公開應用,但已引發大量關注。原因無他,OpenAI發布的演示視頻一度讓人們無法分辨這是人為攝制的還是AI作品,以至于許多人評價它們“毫無AI感”,引人驚呼:“現實不存在了”。
國內外的圈內“大佬”也紛紛下場對Sora給出肯定回應。2月16日,360創始人周鴻祎發表千字長文點贊:“Sora展現的是大模型對真實世界有了理解和模擬之后,會帶來新的成果和突破……這就離AGI(通用人工智能)真的就不遠了,不是10~20年的問題,可能一兩年很快就可以實現。”埃隆·馬斯克則在一條分享Sora生成視頻的帖子下回復:“gg humans”(gg為網絡游戲用語“good games”的縮寫,可譯為:人類完蛋了)。
不少媒體紛紛引用這些評價,并將Sora與“世界模型”“通用人工智能”等詞語聯系起來,大有Sora已掃清通往AGI之路的障礙之勢。
筆者翻看了OpenAI發布的Sora生成的48個演示視頻,也被其逼真的畫面、富有想象力的場景、多視角的流暢切換等所震撼。相比2023年Runway、Pika等發布的AI視頻,Sora在時長、精細度、真實性等方面均呈現出了長足的進步。
但這就是“世界模型”乃至AGI的終章了嗎?筆者認為還言之過早。
首先,盡管Sora能夠生成真假難辨的視頻內容,但這并不能證明AI已經能夠掌握了物理規律、理解了運動中的物理世界。換言之,Sora的出色僅體現在它作為文生視頻工具的能力方面,并不代表它具備了實現通用人工智能的潛力。
根據OpenAI官網上的技術文檔介紹,Sora的成功,在于OpenAI團隊對如何在視頻數據上進行大規模的生成模型訓練進行了探索,并在探索中從大語言模型(LLM)中汲取了靈感——將各種類型的視覺數據轉化為統一的表示方法“patch”(類似于LLM中的token),以便進行大規模生成模型的訓練。
這種工程技術上的進步,使得大模型能夠輸出讓人眼前一亮的結果。但這并不能證明Sora在視覺數據訓練中掌握了人類世界的全部知識,更無法佐證其“煉成”了“世界模型”。
有細心的網友肯定也發現了Sora演示視頻中一些有違常理的畫面,如畫面中的動物無緣無故地增加或消失、物體反重力上升等,這正符合其作為AIGC工具“不會對發現知識、生成數據中的錯誤風險負責”的預期。
OpenAI自己也稱,Sora模型還存在許多不足,比如它無法準確模擬諸如玻璃碎裂、人們吃東西等許多基本交互的物理效應。顯然,Sora并沒有真正學到世界的運轉規律,比如動量守恒、摩擦作用、不同材料的密度不同、物質不可瞬移等,可見它并非“世界模型”。事實上,目前學界對“世界模型”的定義是什么都眾說紛紜,更休談“煉成”一說了。
其次,Sora的生成效果和效率仍有待商榷。目前,出于多方面的考慮,Sora僅面向少數藝術家和開發者調用,并未開放應用。可以理解的是,當前OpenAI發布的演示視頻大概率是精挑細選出來的“優品”,并不能代表Sora的真實表現。
一類工具或一種生產方式是否可用、好不好用,并不取決于它是否產生了令人眼前一亮的效果,而是它能否給出消滅不確定性的保證、降低工作產出的方差。人們往往更愿意為了保證穩定性而換取一些效果的下降。而以Sora為代表的AI工具是否能夠持續降低這些不確定性,目前還存在巨大疑問。從這個角度來說,Sora盡管表現亮眼,但我們仍應觀其后效,對其未來發展和將引領怎樣的未來保持耐心。
通用人工智能是AI領域科學家為之奮斗的最高目標。知名人工智能科學家、北京通用人工智能研究院院長朱松純這樣描述AGI:它需要在復雜動態的物理和社會環境中滿足三個關鍵要求——處理無限任務、具備自主性、具備價值系統(由價值驅動完成各類任務)。這背后的核心是AI系統要具備相當的“認知架構”,也即人類所熟知的常識、共同的行動規范和價值觀。
從這些描述中可知,實現AGI的難度在當下是非常巨大的。事實上,OpenAI在言及AGI時的用詞就十分考究:“Sora是理解和模擬現實世界的模型的基礎,而這一能力將是實現AGI的重要里程碑。”
對人工智能技術的階段性突破略有些溢美之詞,照理來說屬于人之常情;但動輒言及“實現AGI”“人類gg”這類夸大之詞,反而可能產生副作用,稍不留神就會造成誤讀。AI的確是非常開放的空間,人們沿著這一技術路線能開發出的產品也充滿著想象,但AI今天已經與人類社會的經濟、政治、文化、倫理等系統深入融合,因此對AI的技術突破評價,還是應嚴謹為宜。
(本報實習生邊歌對此文亦有貢獻,封面圖截自Sora生成的視頻)
本文鏈接:Sora很驚艷,但“實現AGI”還言之過早http://m.lensthegame.com/show-11-3107-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 智能制造行業的投資邏輯