Sora很驚艷，但“實現AGI”還言之過早

2024-02-21 09:14:05 來源：中國科學報

觀看：205

2月15日，一手締造了ChatGPT的OpenAI再發“大招”，發布了其第一個文生視頻大模型Sora。在官方分享的演示視頻中，該模型可以根據用戶輸入的提示詞，生成長達一分鐘、連貫穩定的高清視頻。

雖然Sora還未獲公開應用，但已引發大量關注。原因無他，OpenAI發布的演示視頻一度讓人們無法分辨這是人為攝制的還是AI作品，以至于許多人評價它們“毫無AI感”，引人驚呼：“現實不存在了”。

國內外的圈內“大佬”也紛紛下場對Sora給出肯定回應。2月16日，360創始人周鴻祎發表千字長文點贊：“Sora展現的是大模型對真實世界有了理解和模擬之后，會帶來新的成果和突破……這就離AGI（通用人工智能）真的就不遠了，不是10~20年的問題，可能一兩年很快就可以實現。”埃隆·馬斯克則在一條分享Sora生成視頻的帖子下回復：“gg humans”（gg為網絡游戲用語“good games”的縮寫，可譯為：人類完蛋了）。

不少媒體紛紛引用這些評價，并將Sora與“世界模型”“通用人工智能”等詞語聯系起來，大有Sora已掃清通往AGI之路的障礙之勢。

筆者翻看了OpenAI發布的Sora生成的48個演示視頻，也被其逼真的畫面、富有想象力的場景、多視角的流暢切換等所震撼。相比2023年Runway、Pika等發布的AI視頻，Sora在時長、精細度、真實性等方面均呈現出了長足的進步。

但這就是“世界模型”乃至AGI的終章了嗎？筆者認為還言之過早。

首先，盡管Sora能夠生成真假難辨的視頻內容，但這并不能證明AI已經能夠掌握了物理規律、理解了運動中的物理世界。換言之，Sora的出色僅體現在它作為文生視頻工具的能力方面，并不代表它具備了實現通用人工智能的潛力。

根據OpenAI官網上的技術文檔介紹，Sora的成功，在于OpenAI團隊對如何在視頻數據上進行大規模的生成模型訓練進行了探索，并在探索中從大語言模型（LLM）中汲取了靈感——將各種類型的視覺數據轉化為統一的表示方法“patch”（類似于LLM中的token），以便進行大規模生成模型的訓練。

這種工程技術上的進步，使得大模型能夠輸出讓人眼前一亮的結果。但這并不能證明Sora在視覺數據訓練中掌握了人類世界的全部知識，更無法佐證其“煉成”了“世界模型”。

有細心的網友肯定也發現了Sora演示視頻中一些有違常理的畫面，如畫面中的動物無緣無故地增加或消失、物體反重力上升等，這正符合其作為AIGC工具“不會對發現知識、生成數據中的錯誤風險負責”的預期。

OpenAI自己也稱，Sora模型還存在許多不足，比如它無法準確模擬諸如玻璃碎裂、人們吃東西等許多基本交互的物理效應。顯然，Sora并沒有真正學到世界的運轉規律，比如動量守恒、摩擦作用、不同材料的密度不同、物質不可瞬移等，可見它并非“世界模型”。事實上，目前學界對“世界模型”的定義是什么都眾說紛紜，更休談“煉成”一說了。

其次，Sora的生成效果和效率仍有待商榷。目前，出于多方面的考慮，Sora僅面向少數藝術家和開發者調用，并未開放應用。可以理解的是，當前OpenAI發布的演示視頻大概率是精挑細選出來的“優品”，并不能代表Sora的真實表現。

一類工具或一種生產方式是否可用、好不好用，并不取決于它是否產生了令人眼前一亮的效果，而是它能否給出消滅不確定性的保證、降低工作產出的方差。人們往往更愿意為了保證穩定性而換取一些效果的下降。而以Sora為代表的AI工具是否能夠持續降低這些不確定性，目前還存在巨大疑問。從這個角度來說，Sora盡管表現亮眼，但我們仍應觀其后效，對其未來發展和將引領怎樣的未來保持耐心。

通用人工智能是AI領域科學家為之奮斗的最高目標。知名人工智能科學家、北京通用人工智能研究院院長朱松純這樣描述AGI：它需要在復雜動態的物理和社會環境中滿足三個關鍵要求——處理無限任務、具備自主性、具備價值系統（由價值驅動完成各類任務）。這背后的核心是AI系統要具備相當的“認知架構”，也即人類所熟知的常識、共同的行動規范和價值觀。

從這些描述中可知，實現AGI的難度在當下是非常巨大的。事實上，OpenAI在言及AGI時的用詞就十分考究：“Sora是理解和模擬現實世界的模型的基礎，而這一能力將是實現AGI的重要里程碑。”

對人工智能技術的階段性突破略有些溢美之詞，照理來說屬于人之常情；但動輒言及“實現AGI”“人類gg”這類夸大之詞，反而可能產生副作用，稍不留神就會造成誤讀。AI的確是非常開放的空間，人們沿著這一技術路線能開發出的產品也充滿著想象，但AI今天已經與人類社會的經濟、政治、文化、倫理等系統深入融合，因此對AI的技術突破評價，還是應嚴謹為宜。

（本報實習生邊歌對此文亦有貢獻，封面圖截自Sora生成的視頻）

本文鏈接：Sora很驚艷，但“實現AGI”還言之過早http://m.lensthegame.com/show-11-3107-0.html

聲明：本網站為非營利性網站，本網頁內容由互聯網博主自發貢獻，不代表本站觀點，本站不承擔任何法律責任。天上不會到餡餅，請大家謹防詐騙！若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。

上一篇：智能制造行業的投資邏輯

下一篇：顏寧亮相廣東：我的夢想在深圳已迅速開花結果

Sora很驚艷，但“實現AGI”還言之過早

熱門資訊

推薦資訊

科學最熱文章