“太忙了。”這是清華大學人工智能(AI)國際治理研究院副院長梁正面對記者脫口而出的一句話。
去年11月30日,非營利性研究機構(gòu)OpenAI推出AI聊天機器人ChatGPT,它所展現(xiàn)出的智能涌現(xiàn)能力在全球范圍內(nèi)引發(fā)了一場AI“狂飆”,也在業(yè)界點燃了一場百模大戰(zhàn)。在記者詢問過的每一個和大模型相關(guān)的人中,“忙”是出現(xiàn)頻率最高的詞。
忙碌的景象不僅在國內(nèi),那些大洋彼岸原本早已習慣了“慢慢”打磨產(chǎn)品的AI專家們也進入了“滿負荷”狀態(tài)。“在谷歌、微軟或OpenAI的辦公室里,你能感受到他們的工作節(jié)奏至少比之前快了兩倍。”梁正說。
這一切都是因為以ChatGPT為代表的大語言模型向世人展露出了前所未有的能力,一條通往AGI(通用人工智能)的道路被打通,誰也不希望落于人后。
這一年,人工智能領(lǐng)域發(fā)生的事件比前十年加起來還要多。據(jù)不完全統(tǒng)計,目前國內(nèi)的AI大模型已超過100個。除了百度、阿里等互聯(lián)網(wǎng)大廠,創(chuàng)新工場CEO李開復(fù)、美團創(chuàng)始人王興、搜狗創(chuàng)始人王小川等“科技老兵”紛紛重披戰(zhàn)甲進軍大模型領(lǐng)域。
這一年,大模型改變了公眾的關(guān)注點。據(jù)柯林斯詞典統(tǒng)計,今年人們提及“AI”的次數(shù)是去年的4倍。而有關(guān)AI是否會取代人類的擔憂,也比以往任何時候都緊迫而強烈。
前所未有的變革
“這是傾盆大雨前的一場雨,是一個分水嶺。”OpenAI首席科學家伊利亞·蘇茨克維這樣形容ChatGPT的誕生。
一年前的11月30日,ChatGPT上線,短短5天,用戶數(shù)突破百萬。由于太過火爆,OpenAI不得不暫時關(guān)閉了用戶的測試入口。兩個月后,ChatGPT月活躍用戶破億,刷新了App應(yīng)用用戶過億的最快紀錄。半個月前,OpenAI暫停ChatGPT Plus的新用戶注冊,原因是11月6日的開發(fā)者大會后,用戶量激增。
一年來,ChatGPT從一個只能處理文字信息的網(wǎng)頁端應(yīng)用,變成了一個可以同時處理文字、語音、圖像信息的超級應(yīng)用,每周吸引上億人使用。OpenAI也從一個非營利性研究機構(gòu)變成了估值900億美元的超級“獨角獸”,聚攏了200萬開發(fā)者。在最新演示中,ChatGPT的表現(xiàn)甚至超越了“神筆馬良”——當有人想要做一個創(chuàng)業(yè)助手時,只要把概念說給GPT-4Turbo聽,兩三分鐘后便可生成一個應(yīng)用。
ChatGPT幾乎以一己之力改變了AI研究生態(tài)。在它爆火之前,谷歌是該領(lǐng)域當之無愧的翹楚,不僅論文發(fā)表數(shù)量最多,其對思維鏈路提示、大模型涌現(xiàn)現(xiàn)象的研究也走在前列。那時,自然語言處理、計算機視覺等還是眾人追捧的AI前沿領(lǐng)域;現(xiàn)在,幾乎所有人都涌向OpenAI引領(lǐng)的生成式AI方向。今年2月,研究自然語言處理的復(fù)旦大學計算機科學技術(shù)學院邱錫鵬教授團隊發(fā)布國內(nèi)首個類ChatGPT模型“MOSS”,也曾一度因用戶的大量涌入而“宕機”。
與谷歌技術(shù)路線相比,OpenAI是“力大磚飛”的代表。“我們的算法非常簡單。”伊利亞·蘇茨克維直言不諱。他們把從海量數(shù)據(jù)中獲取的標注信息導(dǎo)入模型,不斷重復(fù)這個過程,最終得到一個超復(fù)雜的“黑箱”,即使是OpenAI首席科學家自己也不知道模型中正在發(fā)生什么。
ChatGPT上線后,全球大科技公司幾乎都發(fā)布了自己的大語言模型,比如谷歌的PaLM2、Meta的Llama2、百度的文心一言、華為的盤古等,但只要使用過這些模型,你就會發(fā)現(xiàn),GPT模型是“獨一檔的存在”。對此,梁正解釋說:“這種差距可能無關(guān)芯片、算法、數(shù)據(jù),純粹是OpenAI比較幸運。”
幸運是指什么?不妨從凱文·凱利的暢銷書《失控》中尋找答案。他在書中預(yù)測生命的智慧來自涌現(xiàn),而科技也是一種生命。伊利亞同樣認為,數(shù)據(jù)在大模型“黑箱”中發(fā)生的就是演化,盡管世界上有很多這樣的“黑箱”,但發(fā)生在GPT身上的涌現(xiàn)與眾不同,如同300多萬年前開始直立行走的“人類祖母”露西。
借助于世界上最大的算力和最強的GPU芯片,這一年,GPT正以人類難以想象的速度繼續(xù)進化。事實上,在基于GPT-3.5模型的ChatGPT上線時,OpenAI已經(jīng)完成了GPT-4的訓(xùn)練。而據(jù)微軟研究院估算,GPT-4已經(jīng)是一個早期的、仍不完整的AGI系統(tǒng)。
業(yè)界認為,800億參數(shù)是大模型得以涌現(xiàn)的“門檻”,這意味著全球有多個大模型可能涌現(xiàn)智能。對于大模型的未來,梁正借用菲爾茨獎得主陶哲軒的說法表達自己的預(yù)見:如果使用得當,到2026年,AI將成為數(shù)學研究和許多其他領(lǐng)域值得信賴的合著者。而數(shù)學,一直是象征人類智力巔峰的學科領(lǐng)域。
前所未有的繁榮
在人工智能投資領(lǐng)域,美國與中國是全球投入最多的兩個國家。隨著ChatGPT的橫空出世,各國對AI的投資繼續(xù)加碼,中美之間的AI投資差距正在縮小。
早在ChatGPT發(fā)布之初,中國計算機學會術(shù)語工委副主任、同濟大學特聘研究員王昊奮就意識到,這是一個改變?nèi)伺c計算機交互模式的“接口”。這也解釋了為何整個科技界對它如此興奮,以至于任何可能“搭邊”的人都動了起來。
浙江大學上海高等研究院常務(wù)副院長、人工智能研究所所長吳飛對大模型的態(tài)度有過一次明顯改變。“今年3月前,我對它還是旁觀待變的態(tài)度,現(xiàn)在我已經(jīng)深刻感受到它的‘通用之力’。”
大模型是比互聯(lián)網(wǎng)門檻更低的“接口”。吳飛解釋說,互聯(lián)網(wǎng)的能力是賦能特定領(lǐng)域、特定任務(wù)。比如用互聯(lián)網(wǎng)賦能餐飲,可以讓程序員做一個美食推薦應(yīng)用,而要賦能體育,則可以做一個體育新聞推送應(yīng)用。因此,現(xiàn)在我們每個人的手機里都裝有各種不同功能的應(yīng)用。大模型則不同,基礎(chǔ)大模型可以解答我們提出的任何問題,但如果想要在專業(yè)上更進一步,則需要垂直領(lǐng)域大模型。
過去一年,吳飛團隊打造了多個垂直領(lǐng)域大模型。只用45TB(萬億字節(jié))法律方面的專業(yè)數(shù)據(jù),他們就訓(xùn)練出了“智海-錄問”,一個為法律從業(yè)者提供法律問答、知識檢索增強問答、案情分析、意圖識別等多項法律輔助服務(wù)的工具。過去一年,該模型已應(yīng)用于浙江省高級人民法院,大大加快了法官審案流程。
科大訊飛今年則一口氣發(fā)布了12款行業(yè)大模型,涉及金融、汽車、運營商、工業(yè)、住建、法律等多個領(lǐng)域。科大訊飛總裁劉慶峰援引知名咨詢機構(gòu)Gartner的數(shù)據(jù)表示,目前全球已有5%的企業(yè)在使用大模型,到2026年,這一數(shù)字將達到80%。
在邱錫鵬看來,大模型在應(yīng)用端的發(fā)力速度會比預(yù)計的更快,覆蓋面也會更廣。因為大部分軟硬件服務(wù)公司都開始接入大模型,在感嘆效率提高的同時,用戶可能不知道自己其實已經(jīng)在使用大模型了。
梁正用30年前的互聯(lián)網(wǎng)“誕生時刻”來類比當下,且相較前者,大模型能夠覆蓋的行業(yè)更多,更加避無可避。他甚至認為,30年的互聯(lián)網(wǎng)繁榮似乎就是為大模型準備的,因為驅(qū)動大模型涌現(xiàn)的主要數(shù)據(jù)來自互聯(lián)網(wǎng)。
這一年,大模型已經(jīng)在教育、醫(yī)療等諸多領(lǐng)域展現(xiàn)出過人本領(lǐng)。不久前,ChatGPT根據(jù)病情描述和檢查報告,幫助一位母親為她的孩子找到了病因——新生兒發(fā)病率最高只有0.025%的脊髓栓系綜合征。此前,這位母親已經(jīng)帶著孩子求醫(yī)3年,求助了17位醫(yī)生,都沒有診斷出原因。
前所未有的分裂
如果說ChatGPT的問世讓全球科技界沉浸在大模型的狂歡之中,那么關(guān)于AI倫理之爭則是新技術(shù)“狂飆”之下的靈魂拷問。
從3月底的千人聯(lián)名信到5月底的AI風險聲明,在要不要繼續(xù)推動大模型發(fā)展、如何防范AI風險上,即使是AI陣營內(nèi)部也呈現(xiàn)出了前所未有的分裂。5月初,有“AI教父”之稱的計算機科學家杰弗里·辛頓離開谷歌,加深了人們對AI是否已經(jīng)失控的擔憂。他坦言,之所以離開谷歌,就是為了完全自由地說出AI潛在的風險,向世人提出警示。
最具戲劇性的事件要屬最近發(fā)生在OpenAI內(nèi)部的“宮斗”:首席執(zhí)行官山姆·奧爾特曼被董事會開除,幾天后,他又宣布重返OpenAI。業(yè)內(nèi)普遍推測,如何規(guī)制AI發(fā)展是公司內(nèi)部矛盾爆發(fā)的導(dǎo)火索。作為掌握最“聰明”大模型的公司,OpenAI的態(tài)度很大程度上代表了AI發(fā)展的最真實狀態(tài),而據(jù)其判斷,AGI有很大概率會在10年內(nèi)到來。
人類已經(jīng)致力于發(fā)展AI超過60年,為什么這一次如此警鈴大作?伊利亞·蘇茨克維表示,AGI與迄今為止人類創(chuàng)造的任何東西都不同,它是有自己目標的完全自主的生物。如果這一天到來,人與AGI的關(guān)系相當于人與動物,只不過這一次站在動物位置上的是人類。
奧爾特曼則表示,AGI只是發(fā)展AI道路上的一個小節(jié)點,他們的遠景目標是創(chuàng)造出遠超人類智能的超級AI。不過即便如此,他仍向美國國會表達了希望加強對OpenAI監(jiān)管的愿望。今年7月,OpenAI首次提出“超級對齊”概念,宣布將投入20%的計算資源、花費4年時間全力打造一個超級對齊系統(tǒng)。
如何保證AI向善?梁正說,目前業(yè)界觀點主要分成了兩派:一派認為應(yīng)該先在AI中普及人類的道德規(guī)范再允許其發(fā)展;另一派則認為AI在發(fā)展中會形成自己的道德規(guī)范,就像人類在群體行為中產(chǎn)生了道德一樣,但前提是AI需要擁有和人類一樣的外形。
一方面人們對可能到來的AGI爭論不休,而另一方面,充分的競爭則會加速AGI的到來。上海交通大學教授江曉原對人類能否對一路“狂飆”的AI適時“踩剎車”表示悲觀。他說,企業(yè)是推動AI“狂飆”的決定性力量,它無法依靠自己的道德慢下來,因為如果你不做,別人就會趕超你。
仍有許多科學家堅信AI只是人類發(fā)明的一件好用的工具,即便如此,它仍然有毀滅人類的風險。清華瑞萊智慧科技有限公司AI治理研究院院長張偉強提出了這樣一個假設(shè):人類總是在不斷試錯的過程中走向成功,而大模型提供了前往正確答案的直通車,人們將由此減少很多試錯機會。正如劉慈欣在科幻作品《鏡子》中描寫的一種人類“結(jié)局”,人類因為從不犯錯而走向滅亡。
還有更多問題
“與上半年的烈火烹油相比,下半年大家對大模型的態(tài)度務(wù)實了許多,它還有很多問題沒有解決,比如模型復(fù)雜度、多模態(tài)融合、模型評測等,我們都在全力解決。”邱錫鵬說。
吳飛也表示,繼續(xù)通過某些任務(wù)對大模型進行特定訓(xùn)練,以期在某個指標上超過ChatGPT,意義可能并不大,中國在大模型上的機會與當年的互聯(lián)網(wǎng)一樣,即從實際應(yīng)用倒逼模型迭代。
許多專家都表示,國內(nèi)大模型的挑戰(zhàn)主要來自兩方面——算力和數(shù)據(jù)。大模型與其他軟件應(yīng)用不同,不僅訓(xùn)練起來費錢,運行起來更燒錢。想要處理用戶輸入的問題,基本上每個字都要在大模型上跑一遍,參數(shù)上千億的大模型,每跑一遍都要調(diào)用多個A100 GPU,每個價值一萬美元,十分“燒錢”。
國內(nèi)使用大模型的用戶畫像也和國外有所區(qū)別。簡單來說,國外有更多高端用戶傾向于使用GPT,這些相對高質(zhì)量的海量數(shù)據(jù)使GPT的迭代比國內(nèi)大模型要快。
如何破局?當務(wù)之急是提高算力。據(jù)浪潮信息、國際數(shù)據(jù)公司(IDC)和清華大學聯(lián)合發(fā)布《2021-2022年全球計算力指數(shù)評估報告》,15個重點國家的計算力指數(shù)平均每提高1個點,國家的數(shù)字經(jīng)濟和GDP將分別增長3.5‰和1.8‰,預(yù)計該趨勢在2021-2025年將繼續(xù)保持。吳飛認為,隨著“算力網(wǎng)”的落地,國內(nèi)大模型會在未來幾年不斷帶來好消息。
大模型是AI發(fā)展唯一正確的路嗎?Meta首席AI科學家楊樂昆對此并不認同。在他看來,大模型是“一條下坡路”,遠離了通往更強大的AI的道路。他在《經(jīng)濟學家》上撰文說:“大型語言模型能有多聰明、能有多準確,都是有限度的,因為它們沒有現(xiàn)實世界的經(jīng)驗。”
邱錫鵬表示,在使用工程性的方法確保自己“不掉隊”的前提下,還要想辦法研究下一代大模型,即在算力不夠的現(xiàn)有條件下,有無新途徑去實現(xiàn)生成式AI。“前者我們只能跟隨,后者則有幾率超越。”他透露,MOSS正朝著這一目標努力。這一年來,它在架構(gòu)上有所創(chuàng)新,規(guī)避了現(xiàn)有系統(tǒng)的一些缺陷;在“對齊”上采用了更人性化、更多維度的幻覺數(shù)據(jù)集,使內(nèi)容生成更安全;在學習能力上也更加主動。
面對大模型高昂的成本和耗能,整個行業(yè)也在尋找解決辦法。一些科技巨頭親自下場研發(fā)芯片,比如谷歌、亞馬遜、微軟,甚至OpenAI都在考慮針對AI運算自研芯片,或是讓消費者購買更適合大模型計算的手機和電腦,分擔算力成本。
“開源會讓創(chuàng)新速度更快。”上海對外經(jīng)貿(mào)大學人工智能與變革管理研究院副院長、上海開源信息技術(shù)協(xié)會秘書長張國鋒說,目前國內(nèi)大模型的開源方式都以企業(yè)為主導(dǎo),并且只開源了整個大模型生態(tài)的一小部分,從而出現(xiàn)了算力分散、算力資源浪費等問題。他建議整合政府、高校、企業(yè)等優(yōu)質(zhì)的大模型生產(chǎn)要素數(shù)據(jù)、算法和算力,采用開源項目的協(xié)作模式和治理方式降低成本,建立大模型時代的“Linux”生態(tài)位。
(原標題:大模型爆火這一年——對ChatGPT在全球引發(fā)AI“狂飆”的觀察與思考)
本文鏈接:大模型爆火,ChatGPT在全球引發(fā)AI“狂飆”http://m.lensthegame.com/show-11-1735-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任,僅提供存儲服務(wù)。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇: 魯迅為何沒有參加“科玄論戰(zhàn)”
下一篇: 這種減肥藥咋成《科學》10大突破之首