OpenAI首個(gè)視頻生成模型發(fā)布
可用文本生成視頻 虛擬與現(xiàn)實(shí)已分不清?Sora將帶來什么
在2月16日,OpenAI宣布推出全新的生成式人工智能模型“Sora”。據(jù)了解,通過文本指令,Sora可以直接輸出長達(dá)60秒的視頻,并且包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個(gè)角色。
這意味著,繼文本、圖像之后,OpenAI將其先進(jìn)的AI技術(shù)拓展到了視頻領(lǐng)域。OpenAI亦表示,Sora是能夠理解和模擬現(xiàn)實(shí)世界的模型的基礎(chǔ),這一能力將是實(shí)現(xiàn)AGI(通用人工智能)的重要里程碑。
對(duì)于OpenAI視頻生成模型的出現(xiàn),業(yè)內(nèi)其實(shí)早有預(yù)期,但仍有人評(píng)價(jià)稱“比想象中來得更快”,亦有人振奮地表示“我們真的看到新工業(yè)革命來臨”。
2月16日,業(yè)內(nèi)分析人士對(duì)記者表示,Sora無疑是人工智能領(lǐng)域的一次重大突破,該技術(shù)不僅展示了AI在理解和創(chuàng)造復(fù)雜視覺內(nèi)容方面的先進(jìn)能力,而且對(duì)內(nèi)容創(chuàng)作、娛樂和影視制作行業(yè)帶來了前所未有的挑戰(zhàn)和機(jī)遇。
Sora視頻的長度和質(zhì)量
超出了迄今為止所見的水平
“一名時(shí)尚女子走在充滿霓虹燈和廣告牌的標(biāo)志性東京街頭,她穿著黑色皮夾克、紅長裙和黑靴子,拎著黑色手袋,戴著太陽鏡,涂著紅色口紅,走路自信又隨意。街道潮濕且反光,在燈光映射下形成鏡面效果,行人走來走去。”這段60秒的視頻,并非真實(shí)拍攝,而是OpenAI最新的“文生視頻”模型Sora,這一段文字描述就是段Prompt(提示詞)。
當(dāng)?shù)貢r(shí)間2月15日,人工智能(AI)巨頭OpenAI宣布,正在研發(fā)“文生視頻”模型Sora,可以創(chuàng)建長達(dá)60秒的視頻,其中包含高度詳細(xì)的場(chǎng)景、復(fù)雜的攝像機(jī)運(yùn)動(dòng)以及充滿活力的情感的多個(gè)角色,也可以根據(jù)靜態(tài)圖像制作動(dòng)畫。OpenAI稱,目前紅隊(duì)成員(red teamers)可以使用Sora來評(píng)估關(guān)鍵的危害或風(fēng)險(xiǎn),還向一些視覺藝術(shù)家、設(shè)計(jì)師和電影制作人提供訪問權(quán)限,以獲取有關(guān)如何改進(jìn)該模型以對(duì)創(chuàng)意專業(yè)人士最有幫助的反饋。
Sora視頻一出,立刻震驚業(yè)界。盡管這不是首個(gè)AI視頻,其他企業(yè)也有類似文本生成視頻的AI模型,谷歌正在測(cè)試名為Lumiere的模型,Meta則有名為Emu的模型,還有人工智能初創(chuàng)企業(yè)Runway也在開發(fā)相應(yīng)產(chǎn)品來幫助制作視頻,但外媒指出,人工智能專家和分析師表示,Sora視頻的長度和質(zhì)量超出了迄今為止所見的水平。
美國伊利諾伊大學(xué)香檳分校信息科學(xué)教授Ted Underwood指出,沒想到在兩三年內(nèi)還會(huì)有如此持續(xù)連貫水平的視頻生成技術(shù),OpenAI的視頻可能展現(xiàn)了該模型的最佳性能。
多名AI從業(yè)者稱,從Sora公布的預(yù)覽視頻來看,簡直太“瘋狂”。在國外Reditt社區(qū),有個(gè)網(wǎng)友提問,今天OpenAI公布的Sora模型是否會(huì)成為自動(dòng)化對(duì)于經(jīng)濟(jì)影響的里程碑?下面有將近100條回復(fù),有網(wǎng)友稱,起初ChatGPT的發(fā)布讓用戶看到了一切皆有可能,而現(xiàn)在人工智能正在不斷進(jìn)步發(fā)展,讓用戶看到了強(qiáng)大的技術(shù)能力。
有海外網(wǎng)友評(píng)論稱,Sora的出現(xiàn)是一項(xiàng)改變世界的產(chǎn)品,但同時(shí)也指出,Sora生成的視頻或許讓人工智能專家也難以分辨真假,這或許是個(gè)棘手的問題。
內(nèi)容創(chuàng)作領(lǐng)域開啟新紀(jì)元
確保內(nèi)容真實(shí)透明成重要問題
2021年初和2022年末,OpenAI分別推出了圖像生成系統(tǒng)DALL?E和聊天機(jī)器人ChatGPT。這也使得AI逐漸成為各行各業(yè)輔助工作的工具,也正逐漸改變?nèi)藗儗?duì)未來工作的看法。據(jù)介紹,Sora是基于過去對(duì)DALL?E和GPT的研究基礎(chǔ)構(gòu)建,利用DALL?E 3的重述提示詞技術(shù),為視覺模型訓(xùn)練數(shù)據(jù)生成高描述性的標(biāo)注,因此模型能更好的遵循文本指令。
Sora能夠生成具有多個(gè)角色、特定類型的運(yùn)動(dòng)以及主題和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場(chǎng)景。不僅了解用戶在提示中要求的內(nèi)容,還了解這些東西在物理世界中的存在方式。同時(shí),該模型對(duì)語言有深刻的理解,使其能夠準(zhǔn)確地解釋提示并生成表達(dá)生動(dòng)情感的引人注目的角色。
對(duì)于Sora的面世,工信部信息通信經(jīng)濟(jì)專家委員會(huì)委員、數(shù)字經(jīng)濟(jì)專家劉興亮稱,這標(biāo)志著AI技術(shù)在內(nèi)容創(chuàng)作領(lǐng)域的一個(gè)新紀(jì)元。“技術(shù)創(chuàng)新的這一巨大飛躍,預(yù)示著AI在未來人類生活的各個(gè)方面都將發(fā)揮更加重要的作用。”劉興亮表示。
而Sora以文字為核心的提示,將能夠形成更加符合人類觀念的連續(xù)視頻,該模型的出現(xiàn)無疑將會(huì)對(duì)人們現(xiàn)有工作方式進(jìn)行再一次迭代,同時(shí)也會(huì)對(duì)傳統(tǒng)行業(yè)轉(zhuǎn)型提出新的挑戰(zhàn)。
生成式AI過去已積累了不少圖像、聲音等素材,并通過不斷學(xué)習(xí)形成了更為成熟的算法。因此,若是可以通過AI在計(jì)算機(jī)中創(chuàng)建視頻素材,或許將對(duì)影視行業(yè)產(chǎn)生重大影響。
劉興亮稱,AI生成的視頻可能減少了對(duì)人類演員、導(dǎo)演和其他創(chuàng)意角色的需求,從而影響到這個(gè)行業(yè)的就業(yè)。此外,隨著AI技術(shù)的進(jìn)步,傳統(tǒng)的影視制作流程和商業(yè)模式也可能面臨重塑。
不過,劉興亮指出,這種轉(zhuǎn)型并不意味著傳統(tǒng)影視行業(yè)的消亡,而是需要與AI技術(shù)融合,探索新的藝術(shù)形式和表達(dá)方式。
劉興亮同時(shí)提到,隨著AI生成內(nèi)容與現(xiàn)實(shí)之間的界限變得越來越模糊,如何確保內(nèi)容的真實(shí)性和透明性成為了一個(gè)重要問題。此外,版權(quán)、隱私和數(shù)據(jù)安全等問題也需要得到妥善解決。社會(huì)必須面對(duì)這些挑戰(zhàn),通過制定相關(guān)政策、法律和倫理準(zhǔn)則來確保技術(shù)的健康發(fā)展,同時(shí)保護(hù)個(gè)人和社會(huì)的利益不受侵害。
拉大產(chǎn)業(yè)競(jìng)爭差距
AI生成視頻技術(shù)或?qū)⑦M(jìn)入爆發(fā)期
對(duì)于Sora當(dāng)前存在的弱點(diǎn),OpenAI指出它可能難以準(zhǔn)確模擬復(fù)雜場(chǎng)景的物理原理,并且可能無法理解因果關(guān)系。該模型還可能混淆提示的空間細(xì)節(jié),例如混淆左右,并且可能難以精確描述隨著時(shí)間推移發(fā)生的事件,例如遵循特定的相機(jī)軌跡。
以此次發(fā)布的DEMO“與中國龍一起慶祝農(nóng)歷新年的視頻”為例,Sora無法準(zhǔn)確生成視頻畫面中的中文受到了網(wǎng)友的關(guān)注。有相關(guān)人士對(duì)此調(diào)侃道:“莫非是中文太難了?”
但是任何事件的發(fā)生都是從無到有,再從有到精的過程。據(jù)悉,Sora如今正面向部分用戶開放,以評(píng)估關(guān)鍵領(lǐng)域的潛在危害或風(fēng)險(xiǎn)。同時(shí),OpenAI也邀請(qǐng)了一批視覺藝術(shù)家、設(shè)計(jì)師和電影制作人加入,期望獲得寶貴反饋,以推動(dòng)模型進(jìn)步,更好地助力創(chuàng)意工作者。OpenAI提前分享研究進(jìn)展,旨在與OpenAI以外的人士合作并獲取反饋,讓公眾了解即將到來的AI技術(shù)新篇章。
OpenAI表示,他們正在教AI理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練模型來幫助人們解決需要現(xiàn)實(shí)世界交互的問題。
而相比于其自身缺陷,該技術(shù)的廣泛前景更為外界所關(guān)注。
近兩年,由于人工智能發(fā)展迅速,以至于很多企業(yè)紛紛加大了對(duì)人工智能的投入。科技創(chuàng)業(yè)公司研究機(jī)構(gòu)PitchBook估計(jì),2023年全球生成式AI的市場(chǎng)規(guī)模將達(dá)426億美元,2026年則將達(dá)到981億美元,未來增長動(dòng)能可期。
隨著生成式人工智能的市場(chǎng)潛力不斷地被挖掘,大大小小的競(jìng)爭對(duì)手開始浮出水面。
當(dāng)前,參與該賽道的企業(yè)不乏亞馬遜、微軟、谷歌、百度、阿里等眾多互聯(lián)網(wǎng)巨頭,也包括Runway等初創(chuàng)企業(yè)。
有行業(yè)人士指出,隨著Sora的發(fā)布,OpenAI在行業(yè)的領(lǐng)先程度立即加大,會(huì)將大家緊追的距離再度拉開一大截。未來,解決了人物一致性問題之后,AI生成視頻將大踏步前進(jìn),AI視頻或進(jìn)入大爆發(fā)期。
綜合澎湃新聞、每日經(jīng)濟(jì)新聞
來源:成都商報(bào)
本文鏈接:可用文本生成視頻 虛擬與現(xiàn)實(shí)已分不清?Sora將帶來什么http://m.lensthegame.com/show-5-6843-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任,僅提供存儲(chǔ)服務(wù)。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇: 27億元票房領(lǐng)跑春節(jié)檔 憑什么《熱辣滾燙》?
下一篇: 天津重點(diǎn)監(jiān)測(cè)商貿(mào)企業(yè)春節(jié)假期銷售額同比增11.2%