大模型爆火，ChatGPT在全球引發(fā)AI“狂飆”

2023-12-17 23:21:22 來源：文匯報

觀看：669

“太忙了。”這是清華大學人工智能（AI）國際治理研究院副院長梁正面對記者脫口而出的一句話。

去年11月30日，非營利性研究機構(gòu)OpenAI推出AI聊天機器人ChatGPT，它所展現(xiàn)出的智能涌現(xiàn)能力在全球范圍內(nèi)引發(fā)了一場AI“狂飆”，也在業(yè)界點燃了一場百模大戰(zhàn)。在記者詢問過的每一個和大模型相關(guān)的人中，“忙”是出現(xiàn)頻率最高的詞。

忙碌的景象不僅在國內(nèi)，那些大洋彼岸原本早已習慣了“慢慢”打磨產(chǎn)品的AI專家們也進入了“滿負荷”狀態(tài)。“在谷歌、微軟或OpenAI的辦公室里，你能感受到他們的工作節(jié)奏至少比之前快了兩倍。”梁正說。

這一切都是因為以ChatGPT為代表的大語言模型向世人展露出了前所未有的能力，一條通往AGI（通用人工智能）的道路被打通，誰也不希望落于人后。

這一年，人工智能領(lǐng)域發(fā)生的事件比前十年加起來還要多。據(jù)不完全統(tǒng)計，目前國內(nèi)的AI大模型已超過100個。除了百度、阿里等互聯(lián)網(wǎng)大廠，創(chuàng)新工場CEO李開復(fù)、美團創(chuàng)始人王興、搜狗創(chuàng)始人王小川等“科技老兵”紛紛重披戰(zhàn)甲進軍大模型領(lǐng)域。

這一年，大模型改變了公眾的關(guān)注點。據(jù)柯林斯詞典統(tǒng)計，今年人們提及“AI”的次數(shù)是去年的4倍。而有關(guān)AI是否會取代人類的擔憂，也比以往任何時候都緊迫而強烈。

前所未有的變革

“這是傾盆大雨前的一場雨，是一個分水嶺。”OpenAI首席科學家伊利亞·蘇茨克維這樣形容ChatGPT的誕生。

一年前的11月30日，ChatGPT上線，短短5天，用戶數(shù)突破百萬。由于太過火爆，OpenAI不得不暫時關(guān)閉了用戶的測試入口。兩個月后，ChatGPT月活躍用戶破億，刷新了App應(yīng)用用戶過億的最快紀錄。半個月前，OpenAI暫停ChatGPT Plus的新用戶注冊，原因是11月6日的開發(fā)者大會后，用戶量激增。

一年來，ChatGPT從一個只能處理文字信息的網(wǎng)頁端應(yīng)用，變成了一個可以同時處理文字、語音、圖像信息的超級應(yīng)用，每周吸引上億人使用。OpenAI也從一個非營利性研究機構(gòu)變成了估值900億美元的超級“獨角獸”，聚攏了200萬開發(fā)者。在最新演示中，ChatGPT的表現(xiàn)甚至超越了“神筆馬良”——當有人想要做一個創(chuàng)業(yè)助手時，只要把概念說給GPT-4Turbo聽，兩三分鐘后便可生成一個應(yīng)用。

ChatGPT幾乎以一己之力改變了AI研究生態(tài)。在它爆火之前，谷歌是該領(lǐng)域當之無愧的翹楚，不僅論文發(fā)表數(shù)量最多，其對思維鏈路提示、大模型涌現(xiàn)現(xiàn)象的研究也走在前列。那時，自然語言處理、計算機視覺等還是眾人追捧的AI前沿領(lǐng)域；現(xiàn)在，幾乎所有人都涌向OpenAI引領(lǐng)的生成式AI方向。今年2月，研究自然語言處理的復(fù)旦大學計算機科學技術(shù)學院邱錫鵬教授團隊發(fā)布國內(nèi)首個類ChatGPT模型“MOSS”，也曾一度因用戶的大量涌入而“宕機”。

與谷歌技術(shù)路線相比，OpenAI是“力大磚飛”的代表。“我們的算法非常簡單。”伊利亞·蘇茨克維直言不諱。他們把從海量數(shù)據(jù)中獲取的標注信息導(dǎo)入模型，不斷重復(fù)這個過程，最終得到一個超復(fù)雜的“黑箱”，即使是OpenAI首席科學家自己也不知道模型中正在發(fā)生什么。

ChatGPT上線后，全球大科技公司幾乎都發(fā)布了自己的大語言模型，比如谷歌的PaLM2、Meta的Llama2、百度的文心一言、華為的盤古等，但只要使用過這些模型，你就會發(fā)現(xiàn)，GPT模型是“獨一檔的存在”。對此，梁正解釋說：“這種差距可能無關(guān)芯片、算法、數(shù)據(jù)，純粹是OpenAI比較幸運。”

幸運是指什么？不妨從凱文·凱利的暢銷書《失控》中尋找答案。他在書中預(yù)測生命的智慧來自涌現(xiàn)，而科技也是一種生命。伊利亞同樣認為，數(shù)據(jù)在大模型“黑箱”中發(fā)生的就是演化，盡管世界上有很多這樣的“黑箱”，但發(fā)生在GPT身上的涌現(xiàn)與眾不同，如同300多萬年前開始直立行走的“人類祖母”露西。

借助于世界上最大的算力和最強的GPU芯片，這一年，GPT正以人類難以想象的速度繼續(xù)進化。事實上，在基于GPT-3.5模型的ChatGPT上線時，OpenAI已經(jīng)完成了GPT-4的訓(xùn)練。而據(jù)微軟研究院估算，GPT-4已經(jīng)是一個早期的、仍不完整的AGI系統(tǒng)。

業(yè)界認為，800億參數(shù)是大模型得以涌現(xiàn)的“門檻”，這意味著全球有多個大模型可能涌現(xiàn)智能。對于大模型的未來，梁正借用菲爾茨獎得主陶哲軒的說法表達自己的預(yù)見：如果使用得當，到2026年，AI將成為數(shù)學研究和許多其他領(lǐng)域值得信賴的合著者。而數(shù)學，一直是象征人類智力巔峰的學科領(lǐng)域。

前所未有的繁榮

在人工智能投資領(lǐng)域，美國與中國是全球投入最多的兩個國家。隨著ChatGPT的橫空出世，各國對AI的投資繼續(xù)加碼，中美之間的AI投資差距正在縮小。

早在ChatGPT發(fā)布之初，中國計算機學會術(shù)語工委副主任、同濟大學特聘研究員王昊奮就意識到，這是一個改變?nèi)伺c計算機交互模式的“接口”。這也解釋了為何整個科技界對它如此興奮，以至于任何可能“搭邊”的人都動了起來。

浙江大學上海高等研究院常務(wù)副院長、人工智能研究所所長吳飛對大模型的態(tài)度有過一次明顯改變。“今年3月前，我對它還是旁觀待變的態(tài)度，現(xiàn)在我已經(jīng)深刻感受到它的‘通用之力’。”

大模型是比互聯(lián)網(wǎng)門檻更低的“接口”。吳飛解釋說，互聯(lián)網(wǎng)的能力是賦能特定領(lǐng)域、特定任務(wù)。比如用互聯(lián)網(wǎng)賦能餐飲，可以讓程序員做一個美食推薦應(yīng)用，而要賦能體育，則可以做一個體育新聞推送應(yīng)用。因此，現(xiàn)在我們每個人的手機里都裝有各種不同功能的應(yīng)用。大模型則不同，基礎(chǔ)大模型可以解答我們提出的任何問題，但如果想要在專業(yè)上更進一步，則需要垂直領(lǐng)域大模型。

過去一年，吳飛團隊打造了多個垂直領(lǐng)域大模型。只用45TB（萬億字節(jié)）法律方面的專業(yè)數(shù)據(jù)，他們就訓(xùn)練出了“智海-錄問”，一個為法律從業(yè)者提供法律問答、知識檢索增強問答、案情分析、意圖識別等多項法律輔助服務(wù)的工具。過去一年，該模型已應(yīng)用于浙江省高級人民法院，大大加快了法官審案流程。

科大訊飛今年則一口氣發(fā)布了12款行業(yè)大模型，涉及金融、汽車、運營商、工業(yè)、住建、法律等多個領(lǐng)域。科大訊飛總裁劉慶峰援引知名咨詢機構(gòu)Gartner的數(shù)據(jù)表示，目前全球已有5%的企業(yè)在使用大模型，到2026年，這一數(shù)字將達到80%。

在邱錫鵬看來，大模型在應(yīng)用端的發(fā)力速度會比預(yù)計的更快，覆蓋面也會更廣。因為大部分軟硬件服務(wù)公司都開始接入大模型，在感嘆效率提高的同時，用戶可能不知道自己其實已經(jīng)在使用大模型了。

梁正用30年前的互聯(lián)網(wǎng)“誕生時刻”來類比當下，且相較前者，大模型能夠覆蓋的行業(yè)更多，更加避無可避。他甚至認為，30年的互聯(lián)網(wǎng)繁榮似乎就是為大模型準備的，因為驅(qū)動大模型涌現(xiàn)的主要數(shù)據(jù)來自互聯(lián)網(wǎng)。

這一年，大模型已經(jīng)在教育、醫(yī)療等諸多領(lǐng)域展現(xiàn)出過人本領(lǐng)。不久前，ChatGPT根據(jù)病情描述和檢查報告，幫助一位母親為她的孩子找到了病因——新生兒發(fā)病率最高只有0.025%的脊髓栓系綜合征。此前，這位母親已經(jīng)帶著孩子求醫(yī)3年，求助了17位醫(yī)生，都沒有診斷出原因。

前所未有的分裂

如果說ChatGPT的問世讓全球科技界沉浸在大模型的狂歡之中，那么關(guān)于AI倫理之爭則是新技術(shù)“狂飆”之下的靈魂拷問。

從3月底的千人聯(lián)名信到5月底的AI風險聲明，在要不要繼續(xù)推動大模型發(fā)展、如何防范AI風險上，即使是AI陣營內(nèi)部也呈現(xiàn)出了前所未有的分裂。5月初，有“AI教父”之稱的計算機科學家杰弗里·辛頓離開谷歌，加深了人們對AI是否已經(jīng)失控的擔憂。他坦言，之所以離開谷歌，就是為了完全自由地說出AI潛在的風險，向世人提出警示。

最具戲劇性的事件要屬最近發(fā)生在OpenAI內(nèi)部的“宮斗”：首席執(zhí)行官山姆·奧爾特曼被董事會開除，幾天后，他又宣布重返OpenAI。業(yè)內(nèi)普遍推測，如何規(guī)制AI發(fā)展是公司內(nèi)部矛盾爆發(fā)的導(dǎo)火索。作為掌握最“聰明”大模型的公司，OpenAI的態(tài)度很大程度上代表了AI發(fā)展的最真實狀態(tài)，而據(jù)其判斷，AGI有很大概率會在10年內(nèi)到來。

人類已經(jīng)致力于發(fā)展AI超過60年，為什么這一次如此警鈴大作？伊利亞·蘇茨克維表示，AGI與迄今為止人類創(chuàng)造的任何東西都不同，它是有自己目標的完全自主的生物。如果這一天到來，人與AGI的關(guān)系相當于人與動物，只不過這一次站在動物位置上的是人類。

奧爾特曼則表示，AGI只是發(fā)展AI道路上的一個小節(jié)點，他們的遠景目標是創(chuàng)造出遠超人類智能的超級AI。不過即便如此，他仍向美國國會表達了希望加強對OpenAI監(jiān)管的愿望。今年7月，OpenAI首次提出“超級對齊”概念，宣布將投入20%的計算資源、花費4年時間全力打造一個超級對齊系統(tǒng)。

如何保證AI向善？梁正說，目前業(yè)界觀點主要分成了兩派：一派認為應(yīng)該先在AI中普及人類的道德規(guī)范再允許其發(fā)展；另一派則認為AI在發(fā)展中會形成自己的道德規(guī)范，就像人類在群體行為中產(chǎn)生了道德一樣，但前提是AI需要擁有和人類一樣的外形。

一方面人們對可能到來的AGI爭論不休，而另一方面，充分的競爭則會加速AGI的到來。上海交通大學教授江曉原對人類能否對一路“狂飆”的AI適時“踩剎車”表示悲觀。他說，企業(yè)是推動AI“狂飆”的決定性力量，它無法依靠自己的道德慢下來，因為如果你不做，別人就會趕超你。

仍有許多科學家堅信AI只是人類發(fā)明的一件好用的工具，即便如此，它仍然有毀滅人類的風險。清華瑞萊智慧科技有限公司AI治理研究院院長張偉強提出了這樣一個假設(shè)：人類總是在不斷試錯的過程中走向成功，而大模型提供了前往正確答案的直通車，人們將由此減少很多試錯機會。正如劉慈欣在科幻作品《鏡子》中描寫的一種人類“結(jié)局”，人類因為從不犯錯而走向滅亡。

還有更多問題

“與上半年的烈火烹油相比，下半年大家對大模型的態(tài)度務(wù)實了許多，它還有很多問題沒有解決，比如模型復(fù)雜度、多模態(tài)融合、模型評測等，我們都在全力解決。”邱錫鵬說。

吳飛也表示，繼續(xù)通過某些任務(wù)對大模型進行特定訓(xùn)練，以期在某個指標上超過ChatGPT，意義可能并不大，中國在大模型上的機會與當年的互聯(lián)網(wǎng)一樣，即從實際應(yīng)用倒逼模型迭代。

許多專家都表示，國內(nèi)大模型的挑戰(zhàn)主要來自兩方面——算力和數(shù)據(jù)。大模型與其他軟件應(yīng)用不同，不僅訓(xùn)練起來費錢，運行起來更燒錢。想要處理用戶輸入的問題，基本上每個字都要在大模型上跑一遍，參數(shù)上千億的大模型，每跑一遍都要調(diào)用多個A100 GPU，每個價值一萬美元，十分“燒錢”。

國內(nèi)使用大模型的用戶畫像也和國外有所區(qū)別。簡單來說，國外有更多高端用戶傾向于使用GPT，這些相對高質(zhì)量的海量數(shù)據(jù)使GPT的迭代比國內(nèi)大模型要快。

如何破局？當務(wù)之急是提高算力。據(jù)浪潮信息、國際數(shù)據(jù)公司（IDC）和清華大學聯(lián)合發(fā)布《2021-2022年全球計算力指數(shù)評估報告》，15個重點國家的計算力指數(shù)平均每提高1個點，國家的數(shù)字經(jīng)濟和GDP將分別增長3.5‰和1.8‰，預(yù)計該趨勢在2021-2025年將繼續(xù)保持。吳飛認為，隨著“算力網(wǎng)”的落地，國內(nèi)大模型會在未來幾年不斷帶來好消息。

大模型是AI發(fā)展唯一正確的路嗎？Meta首席AI科學家楊樂昆對此并不認同。在他看來，大模型是“一條下坡路”，遠離了通往更強大的AI的道路。他在《經(jīng)濟學家》上撰文說：“大型語言模型能有多聰明、能有多準確，都是有限度的，因為它們沒有現(xiàn)實世界的經(jīng)驗。”

邱錫鵬表示，在使用工程性的方法確保自己“不掉隊”的前提下，還要想辦法研究下一代大模型，即在算力不夠的現(xiàn)有條件下，有無新途徑去實現(xiàn)生成式AI。“前者我們只能跟隨，后者則有幾率超越。”他透露，MOSS正朝著這一目標努力。這一年來，它在架構(gòu)上有所創(chuàng)新，規(guī)避了現(xiàn)有系統(tǒng)的一些缺陷；在“對齊”上采用了更人性化、更多維度的幻覺數(shù)據(jù)集，使內(nèi)容生成更安全；在學習能力上也更加主動。

面對大模型高昂的成本和耗能，整個行業(yè)也在尋找解決辦法。一些科技巨頭親自下場研發(fā)芯片，比如谷歌、亞馬遜、微軟，甚至OpenAI都在考慮針對AI運算自研芯片，或是讓消費者購買更適合大模型計算的手機和電腦，分擔算力成本。

“開源會讓創(chuàng)新速度更快。”上海對外經(jīng)貿(mào)大學人工智能與變革管理研究院副院長、上海開源信息技術(shù)協(xié)會秘書長張國鋒說，目前國內(nèi)大模型的開源方式都以企業(yè)為主導(dǎo)，并且只開源了整個大模型生態(tài)的一小部分，從而出現(xiàn)了算力分散、算力資源浪費等問題。他建議整合政府、高校、企業(yè)等優(yōu)質(zhì)的大模型生產(chǎn)要素數(shù)據(jù)、算法和算力，采用開源項目的協(xié)作模式和治理方式降低成本，建立大模型時代的“Linux”生態(tài)位。

（原標題：大模型爆火這一年——對ChatGPT在全球引發(fā)AI“狂飆”的觀察與思考）

本文鏈接：大模型爆火，ChatGPT在全球引發(fā)AI“狂飆”http://m.lensthegame.com/show-11-1735-0.html

聲明：本網(wǎng)站為非營利性網(wǎng)站，本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻，不代表本站觀點，本站不承擔任何法律責任，僅提供存儲服務(wù)。天上不會到餡餅，請大家謹防詐騙！若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。

上一篇：魯迅為何沒有參加“科玄論戰(zhàn)”

下一篇：這種減肥藥咋成《科學》10大突破之首

大模型爆火，ChatGPT在全球引發(fā)AI“狂飆”

熱門資訊

推薦資訊

科學最熱文章