21世紀經濟報道記者 王俊 馮戀閣 實習生湯雨昕 李伊靜 北京、廣州報道
人工智能從理論走向應用的腳步加快。隨著技術不斷演進,我們迎來了更加智能化的時代,人工智能在各個領域都呈現出日益增長的影響力。
2024年,進化之路上AI將有怎樣的顛覆性突破?其應用場景、商業模式的迭代和革新會給人類帶來危機還是新機?
1月28日,南財合規科技研究院與中國社科院法學所網絡與信息法研究室共同發布《2024年十大AI趨勢預測》,研究團隊結合2023年全球的人工智能發展、應用情況,試圖從技術、商業以及治理的維度對行業發展做出預測。該預測在中國社會科學院法學研究所主辦的“人工智能安全治理研討會”暨中國社會科學院“人工智能安全治理研究”實驗室孵化研討會上發布。
2024年十大AI趨勢為:
1、開源模型性能日益強大,有望與閉源模型分庭抗禮
2、AI Agent快速崛起,助力大模型應用落地
3、多模態大模型成為AI產業競爭重要陣地
4、AI應用場景爆發,“AI+”實踐補齊商業化短板
5、具身智能,通用人工智能探索的下一節點
6、高質量數據稀缺,合成數據或成解法
7、新型智算中心、數據中心加快布局 成為關鍵基礎設施
8、人工智能版權糾紛大量涌入司法實踐
9、一批AI創業公司在2024年倒閉
10、安全可信AI訴求催生新技術、新商業工具
1、開源模型性能日益強大,有望與閉源模型分庭抗禮
以GPT-4為代表的閉源大模型在2023年展現了出眾能力,福布斯預測2024年商業閉源大模型仍將持續領先于開源大模型。
開源代表Yann LeCun(Meta首席AI科學家)、Clem Delangue(Hugging Face CEO)等看好開源大模型的發展,認為開源大模型能夠達到或超越閉源大模型的能力。
自Llama 2后,開源又逐漸成為主流趨勢,2023年底,Meta和IBM宣布共同成立了一個人工智能聯盟,由50多家人工智能公司和研究機構組成,旨在培養開放社區。國內阿里、百川等也在做開源部署。受益于科技公司的資源投入以及全球開源社區的共享協作,開源大模型在速度、適應性以及整體效率方面都有望持續提升。
閉源大模型被視為具有較高的安全性,能夠發揮其保護數據隱私或商業利益的作用,并且能夠將專業力量持續投入到與業務場景的融合中,具備長期服務能力。比如OpenAI也會推出定制化GPT、應用商店等構建以ChatGPT為基礎的閉源模型生態體系。
未來,開源與閉源模型之爭的走向會如何,是互為補充并服務于不同的場景及需求,還是一方碾壓另一方,市場會告訴我們答案。
2、AI Agent快速崛起,助力大模型應用落地
AI Agent是一個控制大模型來解決問題的代理系統,可以理解為大模型、記憶、任務規劃以及工具使用的集合,能夠根據給定任務詳細拆解出每一步的計劃步驟,依靠外界反饋和自主思考,為自己創建prompt以實現目標。
比爾及梅琳達·蓋茨基金會聯席主席比爾·蓋茨預計AI Agent會改變人類與計算機的交互方式,帶來從輸入命令到點擊圖標的計算革命,并將在醫療保健、教育、生產力以及娛樂和購物四個領域產生重要影響。知名科學家李飛飛認為AI Agent作為一種輔助智能體,能夠比完全自動化更早實現。DeepLearning.AI創始人吳恩達則期待在2024年AI Agent將會有新的突破。
從單一Agent發展到多個Agent協調合作,AI Agent可以通過將復雜任務拆解為多個子任務的分工,突破特定領域或場景限制,節約不同流程之間的切換時間,同時不斷提升處理特定任務的技能,提高整個系統的效率和產出質量。
在商業化力量的推動下,AI Agent可能會成為大模型落地業務場景的重要載體,例如幫助企業更加高效便捷地自己構建RPA、CRM、辦公OA等一系列應用,幫助個人規劃和執行一系列動作等。2024年,在AI Agent的代理下,大模型將為我們執行更多任務。
3、多模態大模型成為AI產業競爭的重要陣地
人類通過視覺、語言、聽覺等感知與理解真實世界,AI作為人類智能的延伸也在拓展多模態能力,包括多模態的輸入和多模態的輸出與生成能力。多模態大模型可以處理應用文字、圖片、視頻、音頻等多模態數據,完成聽、說、讀、寫、看等跨模態領域的任務,符合人類最自然的交互習慣,使人與AI的交流更加友好直接。
火爆海外的AI視頻生成工具Pika1.0,其AI模型能生成和編輯 3D 動畫、電影等各種風格視頻。谷歌在2023年年底推出的Gemini模型則能夠分析和理解正在變化的視頻,并生成相應的描述,描述的音頻還會包含一些擬人化的語氣和停頓。國內方面,2024年1月以來,通義千問視覺理解模型Qwen-VL持續升級,零一萬物Yi-VL多模態語言大模型面向全球開源,多模態模型的能力正在快速提升。
由于多模態能夠帶來更豐富的用戶體驗、實現更廣泛的應用場景,2024年多模態大模型將成為AI廠商發力的主要方向,多模態大模型正推動人工智能邁進“通感”時代。
4、AI應用場景爆發,“AI+”實踐補齊商業化短板
2023至2024,AI賦能千行百業腳步走深。賽迪顧問數據顯示,2023 年人工智能在行業應用的采用率已達到 28%。從行業實踐來看,人工智能率先助力金融、游戲、教育、醫療等行業重構。
人工智能必須與應用場景結合才能發揮最大作用。在誕生至今的60余年間,其發展幾次起落,應用場景不足被視為前兩次浪潮歸于沉寂的主要原因之一。
人工智能面向行業的具體應用并非易事,需要把技術邏輯、業務邏輯、場景邏輯和商業邏輯打通。2024年被視為人工智能應用元年,場景創新、應用落地、商業化拓展值得期待。在這條追求更高精度、挑戰更復雜任務、拓展能力邊界的演進之路上,從業者需著眼產業鏈全局布局場景建設,讓AI技術革新惠及整個產業生態。
5、具身智能,通用人工智能探索的下一節點
具身智能(Embodied AI)可以被認為是指能與環境交互獲取信息、理解問題、作出決策并實現行動的智能系統。在ITF World 2023大會上,英偉達創始人黃仁勛公開表示,具身智能將引領人工智能的下一次浪潮。
機器人被認為是具身智能落地的核心場景之一。圖靈獎得主、中國科學院院士姚期智在此前表示,人工智能領域下一個挑戰將是實現“具身通用人工智能”,即構建能夠通過自我學習掌握各種技能并執行現實生活中的種種通用任務的高端機器人。
2023年,AI風起,亦卷動具身智能市場風云。特斯拉人形機器人Optimus迭代加速,商業化持續推進。OpenAI領投人形機器人公司1X,二者或共同為機器人開發AI模型。
大語言模型和多模態大模型能夠通過海量數據預訓練從語音、視覺、感知、控制等多方面幫助機器人更好“進化”。比如,李飛飛團隊發布具身智能研究VoxPoser,通過接入大模型,這一項目使機器人能直接理解人類自然語言指令并完成復雜任務,無需額外的數據和預訓練。
具身智能可能成為大模型應用元年的“高光時刻”之一。
不過,具身智能走向實踐,還面臨不少挑戰。
在2023世界機器人大會上,姚期智指出,未來具身機器人還面臨四大主要挑戰:第一,機器人無法只通過一個基礎大模型直接做最底層的控制,工作相對復雜;第二,即使谷歌研發了Robotics Transformer模型,要實現實際控制,仍需要彌合計算能力的差距;第三,機器人多模態的感官感知的全部融合并非易事;第四,機器人研發、應用等過程中的數據安全問題需要考慮。
6、高質量數據稀缺,合成數據或成解法
作為生成式人工智能的“糧食和血液”,當前高質量數據的供給面臨挑戰。一項來自Epoch Al Research團隊的研究結果表明,高質量的語言數據存量將在2026年耗盡。
對于數據稀缺問題,合成數據或是一個解法。合成數據是指基于計算機模擬技術或算法生成的虛擬數據。國內外企業目前在這一領域已經開展不少嘗試。比如,騰訊開發自動駕駛仿真系統TADSim可以自動生成無需標注的各種交通場景數據;人工智能初創公司Cohere首席執行官AidenGomez就曾公開表示,微軟、OpenAI和Cohere等公司,已使用合成數據來訓練AI模型。
據咨詢公司Gartner預測,到2030年,合成數據將徹底取代真實數據,成為AI模型所使用的數據的主要來源。美國AI研究機構Cognilytica數據顯示,2021 年合成數據市場規模大概在1.1億美元,到2027 年將達到11.5億美元。
不過,當前合成數據的保真度、可控性等仍存問題。AI訓練數據服務商Appen發布的一篇文章中指出,相比于真實數據,合成數據缺乏異常值,這對訓練出的模型精確度會產生很大影響。此外,合成數據的質量與其生成時所用的輸入數據息息相關,因此,輸入數據的質量也會對其產生影響。所以,合成數據投入使用的過程還面臨一定爭議。
因此,合成數據之外,提升真實數據質量也是必行之措。
在國內,多地都曾發布相關政策以求推動建立高質量數據集。2023年,北京、深圳等地先后發布相關文件,指出要提升高質量數據要素供給能力、歸集高質量基礎訓練數據集、建立多模態公共數據集,打造高質量中文語料數據等。同年7月的《生成式人工智能服務管理暫行辦法》中,亦指出要推動生成式人工智能基礎設施和公共訓練數據資源平臺建設。今年國家數據局等17部門聯合印發的《“數據要素×”三年行動計劃(2024—2026年)》指出,應該建設高質量語料庫和基礎科學數據集,支持開展人工智能大模型開發和訓練。
7、新型智算中心、數據中心加快布局 成為關鍵基礎設施
大模型的發展提升了智能算力的需求,目前國內存在高性能芯片短缺、算力資源分散、存力相對不足等問題。需求爆發式增長與算力單點性能極限之間的矛盾日益突出,算力節點通過網絡靈活高效調配算力資源的能力仍存在不足,算網協同和全局調度能力有待提高,難以滿足數據對算力隨需處理的需求。
因此,需以系統化思維構建算力基礎設施平臺,保障算力調度,將分散的算力資源聚合,形成集群效應,實現算力、數據和算法的高效協同,滿足智算應用場景的數據處理、存儲、傳輸等環節要求。
2023年10月,工信部等六部門聯合印發《算力基礎設施高質量發展行動計劃》,其中提出2025年建成50個智能計算中心等量化指標。2024年1月工信部等八部門發布《關于加快傳統制造業轉型升級的指導意見》,提出要探索建設區域人工智能數據處理中心,提供海量數據處理、生成式人工智能工具開發等服務。
接下來,新型數據中心、智算中心的建設和布局是一個重要趨勢,提供多樣性計算綜合能力的算力集群,以滿足千行百業智能化的需求。
8、人工智能版權糾紛大量涌入司法實踐
生成式人工智能技術的快速發展給版權帶來了新的挑戰。
從輸入端看,涉及訓練數據來源合法合規問題。大模型訓練數據多來自網絡中抓取的電子書、藝術作品、電子郵件、歌曲,抓取時并未告知原作者,難以獲得單獨授權,面臨侵權糾紛。
在輸出端,終端用戶、模型提供者的生成內容是否具有可版權性,模型提供者生成內容是否侵權也未有答案。傳統的版權法主要針對人類創作者的作品進行保護,而現在則涉及機器生成的內容。
目前司法實踐中,紐約時報指控OpenAI和微軟訓練大模型使用《紐約時報》大量文本內容侵犯其版權,是輸入端的一個案例。
北京互聯網法院也作出了第一例人工智能生成內容的著作權糾紛判決,是輸出端的一個案例。
2024年,伴隨著人工智能技術的不斷應用,大概率會有大量版權糾紛案件涌入司法實務環節。
9、一批AI創業公司會在2024年倒閉
2023年人工智能領域資本市場火熱。IDC最新數據顯示,2022年全球人工智能IT總投資規模為1,288億美元,2027年預計增至4236億美元,五年復合增長率(CAGR)約為26.9%。
截至2023年12月末,涉及人工智能產業鏈的境內A股上市公司已超過400家,業務領域上涵蓋了人工智能產業鏈的各個環節。科創板已匯聚十家人工智能產業鏈企業,合計市值逾4000億元,初步覆蓋基礎層、技術層及應用層等環節,涵蓋AI芯片、行業大模型、智能機器人、計算機與3D視覺等多個細分賽道。
不過,從海外來看,AI初創公司融資速度正在放緩,Stability AI 和 Jasper 等初創公司都陷入困境。
2024年人工智能創業公司面臨多重挑戰。
市場競爭方面,大型公司憑借其資源和品牌優勢占據大部分市場份額,使得許多初創AI企業難以立足。資金和融資方面,前期大把燒錢卻沒有實際商業化落地,融資會變得越發困難。尤其是商業化和產品落地是最大的挑戰,如果產品與實際業務場景結合不夠緊密,商業化進程受阻。
此外,還面臨法律政策的適應性問題,全球各國、地區監管動態密集,不確定性強。數據隱私和安全合規作為底線,可能增加成本。
10、安全可信AI訴求催生新技術、新商業工具
Gartner預測,生成式AI或將迎來全民化時代,到2026年,將有超過80%的企業使用生成式AI的API或模型,或在生產環境中部署支持生成式AI的應用,而在2023年初這一比例還不到5%。
伴隨著人工智能的大規模應用,安全問題變得更加迫切。2023年以來,生成式人工智能快速發展的同時,數據泄露、個人隱私風險、虛假信息、大模型“幻覺”、算法黑箱......等問題也隨之而來。2023年11月,OpenAI的宮斗大戲把安全對齊、科技倫理等深層安全問題暴露在大眾視野中。
人工智能的安全問題可分為三個維度,第一是內生風險,包括“幻覺”問題、算法歧視、算法黑箱等,第二是衍生風險,其在應用中的風險,比如虛假新聞、個人信息泄露等,第三則是外部風險,外部對模型、系統的攻擊。
面對多重風險,構建安全可信的人工智能已成為共識。未來在解決AI風險的過程中,可能會催生出針對安全對齊、可解釋性等新技術。
此外,針對人工智能內生安全風險、服務商風險、應用產生的數據泄露風險等多維度安全風險,或也會催生新型的商業工具。此前,一家知名保險公司宣布推出專為AI幻覺設計的保險政策。
解決人工智能安全風險是底線,在對安全剛性要求的背景下,或能催生新的安全技術或者商業工具。
本文鏈接:2024年十大AI趨勢預測:安全性訴求催生新技術、商業工具,一批AI創業公司將倒閉?http://m.lensthegame.com/show-2-2457-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
下一篇: 商業故事 丨國產電三輪爆火海外