設(shè)置
          • 日夜間
            隨系統(tǒng)
            淺色
            深色
          • 主題色

          搭建算力、語料公共服務(wù)平臺,上海為大模型基礎(chǔ)底座賦能

          2025-01-29 18:54:02 來源: 澎湃新聞

           V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          “到2025年底,建成世界級人工智能產(chǎn)業(yè)生態(tài);力爭全市智能算力規(guī)模突破100EFLOPS;形成50個(gè)左右具有顯著成效的行業(yè)開放語料庫示范應(yīng)用成果;建設(shè)3—5個(gè)大模型創(chuàng)新加速孵化器,建成一批上下游協(xié)同的賦能中心和垂直模型訓(xùn)練場。”2024年12月,上海發(fā)布《關(guān)于人工智能“模塑申城”的實(shí)施方案》(以下簡稱《實(shí)施方案》),在方案中提出了一系列有關(guān)人工智能產(chǎn)業(yè)發(fā)展的目標(biāo)。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          在先后經(jīng)歷了信息化、數(shù)字化革新后,上海正在積極投入城市“數(shù)智化”建設(shè),為以大模型為代表的新一代人工智能產(chǎn)業(yè)的發(fā)展添瓦加磚,為強(qiáng)化大模型基礎(chǔ)底座賦能。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          在今年1月舉行的上海市“人工智能+”行動(dòng)推進(jìn)大會(huì)暨中國—金磚國家人工智能發(fā)展與合作中心基地啟用儀式上,“模塑申城”五大公共服務(wù)平臺正式亮相,包括由上海儀電集團(tuán)運(yùn)營上海智能算力公共服務(wù)平臺、庫帕思牽頭“模塑申城”語料普惠計(jì)劃、上海人工智能實(shí)驗(yàn)室運(yùn)營大模型評測與驗(yàn)證中心、上海創(chuàng)智學(xué)院牽頭“百人百項(xiàng)”青年科學(xué)家計(jì)劃,以及上海國投—徐匯融資服務(wù)中心。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          作為大模型最重要的燃料,算力和語料直接關(guān)系著大模型產(chǎn)業(yè)落地的進(jìn)展。經(jīng)過并不算長的時(shí)間的跨越式發(fā)展,這兩大關(guān)鍵平臺目前不僅為上海的基礎(chǔ)模型企業(yè)提供保障,同時(shí)也正在順應(yīng)垂類應(yīng)用蓬勃發(fā)展的趨勢,為企業(yè)創(chuàng)新提供高性價(jià)比、高質(zhì)量的算力與語料支持。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          國資扛起算力供給重任V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          曾經(jīng)參與籌辦了以往七屆世界人工智能大會(huì)的孫躍在2024年7月有了新的身份——上海儀電智算科技公司總經(jīng)理。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          “2023年,隨著國產(chǎn)大模型的蓬勃發(fā)展,市里意識到建設(shè)完善支撐大模型發(fā)展的智能算力功能性公共服務(wù)設(shè)施的重要性。”與以往超算中心以CPU為主的算力不同,大模型的訓(xùn)練和推理都需要由GPU支撐,且算力需求呈現(xiàn)指數(shù)級增長。“缺卡缺算力”成為大模型創(chuàng)新的一個(gè)關(guān)鍵掣肘,業(yè)內(nèi)預(yù)計(jì)這種供需不平衡可能在未來三五年都會(huì)持續(xù)存在,人工智能日新月異的迭代速度決定了抓住產(chǎn)業(yè)發(fā)展窗口期的迫切性。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          上海儀電(集團(tuán))有限公司作為大股東承擔(dān)起了上海儀電智算科技公司的牽頭建設(shè)工作。

            ?V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM


          V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          為此上海決定設(shè)立一個(gè)國資的算力平臺,為上海的大模型企業(yè)和科研單位提供基礎(chǔ)的人工智能算力保障,降低創(chuàng)新成本。這一意見很快得到落實(shí),上海儀電(集團(tuán))有限公司作為大股東承擔(dān)起了上海儀電智算科技公司的牽頭建設(shè)工作,當(dāng)年即投入運(yùn)營。
          V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          “經(jīng)過兩年時(shí)間,我們已經(jīng)建成投產(chǎn)了多個(gè)萬卡集群。”孫躍介紹說,目前上海儀電智算科技公司正在為上海的重要大模型企業(yè)以及研究機(jī)構(gòu)提供算力服務(wù),支持他們的科研和大模型開發(fā),包括上海算法創(chuàng)新研究院、大模型創(chuàng)業(yè)企業(yè)階躍星辰等。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          相對于自建集群來說,租用算力可以免去承擔(dān)巨額硬件資產(chǎn)的投入成本。“我們的目標(biāo)是通過相對低成本的規(guī)模化運(yùn)營為上海的人工智能創(chuàng)新企業(yè)和戰(zhàn)略客戶提供靈活的公共算力服務(wù)。”V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          除了成為公共算力服務(wù)商,打造國產(chǎn)算力軟硬件生態(tài)也是上海儀電智算科技公司作為國資功能性平臺的另一個(gè)重要使命。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          “作為上海市智能算力公共服務(wù)平臺,要發(fā)揮國產(chǎn)智算產(chǎn)業(yè)鏈生態(tài)鏈接和引領(lǐng)作用,通過國產(chǎn)芯片軟硬件和解決方案適配來降低國產(chǎn)芯片的使用門檻,讓國產(chǎn)算力能夠更好地服務(wù)大模型發(fā)展。”V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          孫躍介紹,上海儀電智算科技公司從2024年初開始建設(shè)國產(chǎn)化AI算力適配測試中心,目前已完成十余款國產(chǎn)芯片的適配測試,并開展國產(chǎn)軟硬件平臺的適配和新技術(shù)驗(yàn)證,有力支撐了我國自主創(chuàng)新生態(tài)的構(gòu)建。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          伴隨著人工智能技術(shù)的深入發(fā)展和大規(guī)模應(yīng)用,模型后訓(xùn)練和推理需求可能很快會(huì)超過預(yù)訓(xùn)練算力需求,而在此之前,作為上海儀電智算科技公司來說,需要為新一輪產(chǎn)業(yè)和技術(shù)革命的到來提前做好算力保障和穩(wěn)定供應(yīng)的準(zhǔn)備。目前,上海市智能算力公共服務(wù)平臺一方面進(jìn)一步強(qiáng)化規(guī)模化的智算集群工程建設(shè)運(yùn)營能力。同時(shí),著力推動(dòng)基礎(chǔ)設(shè)施IaaS、軟件工具平臺PaaS、語料數(shù)據(jù)層DaaS及模型層MaaS能力整合,提供“訓(xùn)推一體、混合部署”的智算云服務(wù),加速向國內(nèi)一流的智算云公共服務(wù)商轉(zhuǎn)型,支撐本市大模型行業(yè)垂類應(yīng)用和千行百業(yè)數(shù)字化轉(zhuǎn)型。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          語料供給有了正規(guī)軍V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          在AI應(yīng)用中,語料質(zhì)量直接決定了模型的性能。高質(zhì)量的訓(xùn)練數(shù)據(jù)能夠有效減少模型在推理過程中的錯(cuò)誤率,提高模型在實(shí)際應(yīng)用中的創(chuàng)作能力和生成質(zhì)量。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          近兩年,隨著AI技術(shù)的快速發(fā)展,產(chǎn)業(yè)界也越發(fā)意識到數(shù)據(jù)質(zhì)量管理的重要性。不過,數(shù)據(jù)市場普遍存在授權(quán)難、成本高和版權(quán)風(fēng)險(xiǎn)大的問題。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          授權(quán)難是指模型公司難以通過合規(guī)渠道獲取語料,有礙于基礎(chǔ)模型和垂類模型的商業(yè)化應(yīng)用推廣和技術(shù)迭代創(chuàng)新。成本高則體現(xiàn)在當(dāng)前購買語料的價(jià)格大部分是以版權(quán)計(jì)價(jià)的方式進(jìn)行,授權(quán)周期通常為1年,到期還需銷毀,繼續(xù)使用需要再次收費(fèi)。而在版權(quán)方面,近兩年,人工智能版權(quán)糾紛的問題讓大模型公司經(jīng)常處于“風(fēng)口浪尖”上。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          “之前語料數(shù)據(jù)管理市場沒有方法論,俗稱‘亂燉’式,找來的數(shù)據(jù)對提升模型能力究竟有沒有幫助,效果未知。”上海庫帕思科技有限公司(以下簡稱“庫帕思”)董事長山棟明日前在接受澎湃科技采訪時(shí)坦言當(dāng)前數(shù)據(jù)市場存在的“難言之隱”。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          庫帕思成立于2024年3月下旬,是按照上海市委、市政府部署,由上海聯(lián)和(信投)牽頭,協(xié)同相關(guān)數(shù)據(jù)資源方和大模型相關(guān)企業(yè)組建的中國第一家人工智能語料公司,專注于大模型和垂類模型的發(fā)展,聚焦高質(zhì)量人工智能語料供給。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          庫帕思定位是帶有功能性的語料服務(wù)專業(yè)化運(yùn)營平臺,提供一站式的高質(zhì)量語料服務(wù),推進(jìn)多層次語料體系建設(shè)。“通俗理解,我們有三個(gè)角色,一是數(shù)據(jù)標(biāo)注施工隊(duì),二是語料處理總包商,三是語料專業(yè)開發(fā)商。”山棟明介紹說。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          庫帕思定位是帶有功能性的語料服務(wù)專業(yè)化運(yùn)營平臺。

            ?V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          經(jīng)過近一年的實(shí)踐,庫帕思圍繞服務(wù)萬億級參數(shù)模型訓(xùn)練持續(xù)擴(kuò)容基礎(chǔ)語料庫,去年9月完成第二批語料采購和交付任務(wù),已經(jīng)啟動(dòng)第三批語料清單方案。目前已經(jīng)實(shí)現(xiàn)成品語料輸出約200TB,鏈接生態(tài)主體超100家,直接服務(wù)器機(jī)構(gòu)數(shù)量超30家。同時(shí)圍繞打造中國版Sora,推動(dòng)高質(zhì)量多模態(tài)語料供給,與眾多內(nèi)容供給企業(yè)形成合作。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          在語料服務(wù)模式上,庫帕思也改變硬盤拷貝、云端傳輸?shù)葌鹘y(tǒng)數(shù)據(jù)交付方式,根據(jù)基礎(chǔ)模型、垂類模型、端側(cè)模型不同需求,提供語料動(dòng)態(tài)配比、知識修正、價(jià)值對齊、快速封裝等“一站式”交付服務(wù)。庫帕思提出的系統(tǒng)化清洗流程,涵蓋了從數(shù)據(jù)預(yù)處理到語法糾正的多個(gè)步驟。這種方法不僅提高了標(biāo)注數(shù)據(jù)的準(zhǔn)確性,還大大減少了人工干預(yù)的頻率,從而提升了數(shù)據(jù)處理的整體效率。山棟明介紹,傳統(tǒng)數(shù)據(jù)公司只提供原始數(shù)據(jù),而庫帕思提供清洗標(biāo)注后的語料,可直接用于模型訓(xùn)練。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          此外,針對業(yè)內(nèi)缺乏統(tǒng)一的高質(zhì)量數(shù)據(jù)集定義標(biāo)準(zhǔn),導(dǎo)致不同公司、不同機(jī)構(gòu)或平臺即便有了高質(zhì)量數(shù)據(jù),但仍要耗費(fèi)人力和時(shí)間重新處理數(shù)據(jù)標(biāo)注的情況,庫帕思自成立以來也在推動(dòng)語料工作的標(biāo)準(zhǔn)創(chuàng)新。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          在2024世界人工智能大會(huì)語料主題論壇上,庫帕思公司同覆蓋多模態(tài)數(shù)據(jù)資源供應(yīng)、加工、應(yīng)用和運(yùn)營全鏈在內(nèi)的近二十家企業(yè)共同發(fā)布了團(tuán)體標(biāo)準(zhǔn)《語料庫建設(shè)導(dǎo)則》。在語料數(shù)據(jù)清洗方面,庫帕思在國家知識產(chǎn)權(quán)局申請了一項(xiàng)名為“語料數(shù)據(jù)的清洗和質(zhì)檢方法、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品”的專利。該專利公開號為CN119128385A,申請日期為2024年9月。專利的核心在于有效提升語料數(shù)據(jù)的質(zhì)量,這對于AI領(lǐng)域尤其是自然語言處理(NLP)和知識圖譜等應(yīng)用具有深遠(yuǎn)影響。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          “我們把自己定位為人工智能拼圖中的生態(tài)鏈接者,致力于制定行業(yè)標(biāo)準(zhǔn),構(gòu)建AI生態(tài)。”山棟明說。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          為垂類模型企業(yè)降低創(chuàng)新成本V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          伴隨著大模型行業(yè)發(fā)展需求的變化,上海儀電智算科技公司從去年開始也在逐步轉(zhuǎn)型,“起初我們主要任務(wù)是保障基礎(chǔ)大模型用戶,現(xiàn)在隨著大模型行業(yè)應(yīng)用的發(fā)展,我們的服務(wù)對象擴(kuò)展至各類垂類大模型企業(yè)。”孫躍說。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          和基礎(chǔ)大模型相對量大、穩(wěn)定的算力需求相比,垂類模型的算力需求更加靈活,“可能每次需要的量不多,頻率也不穩(wěn)定,這就需要我們有更加靈活的應(yīng)對方案。”為此,從2024年起,上海儀電智算科技公司不僅提供自己的算力,還在打造一個(gè)算力的靈活調(diào)度平臺,通過平臺協(xié)調(diào)其他社會(huì)算力資源,來共同服務(wù)垂類大模型的算力需求。“資源集中化、規(guī)模化后,才能提高資源的有效利用率,從而降低成本。”孫躍介紹說。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          山棟明也表示,自成立以來,庫帕思也在一路探索模型公司對語料需求的變化。和上海智算公司一樣,庫帕思在創(chuàng)立之初也主要服務(wù)于基礎(chǔ)大模型,隨著產(chǎn)業(yè)不斷演進(jìn),模型未來的核心不僅僅是基礎(chǔ)大模型能力本身,而與應(yīng)用緊密掛鉤。在應(yīng)用領(lǐng)域,過往選模型的邏輯并不適用現(xiàn)在,“某些模型整體表現(xiàn)不錯(cuò),但在特定應(yīng)用場景中,表現(xiàn)未必最好”,其中差異的關(guān)鍵在于用于模型訓(xùn)練語料的不同。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          庫帕思的目標(biāo)是大幅降低居高不下的AI應(yīng)用成本,讓開發(fā)垂類模型的中小企業(yè)能夠零門檻使用數(shù)據(jù),實(shí)現(xiàn)“開箱即用”。此外,在垂類領(lǐng)域上,已聚焦“5+6”垂類領(lǐng)域(金融領(lǐng)域、醫(yī)療領(lǐng)域、制造領(lǐng)域、教育領(lǐng)域、文旅領(lǐng)域、城市治理領(lǐng)域)按照“一業(yè)一方法”建設(shè)行業(yè)語料庫。V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          庫帕思聚焦“5+6”垂類領(lǐng)域按照“一業(yè)一方法”建設(shè)行業(yè)語料庫。

          V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          此外,庫帕思也在發(fā)力具身智能、機(jī)器人等前沿垂類領(lǐng)域的高維語料需求市場,目前該公司已經(jīng)聯(lián)合上海國地中心、智元、傅利葉、開普勒、21所編制發(fā)布《具身智能語料庫建設(shè)導(dǎo)則》,下一步庫帕思將推動(dòng)具身智能真機(jī)數(shù)據(jù)采集上規(guī)模和上質(zhì)量,在世界人工智能大會(huì)前將發(fā)布更大規(guī)模、更多樣場景的具身智能語料庫。此外,進(jìn)一步增強(qiáng)語料智能清洗與質(zhì)量保障、智能合成和模型價(jià)值對齊、智能配比和知識修正等方面的技術(shù)能力。
          V5Y流量資訊——探索最新科技、每天知道多一點(diǎn)LLSUM.COM

          本文鏈接:搭建算力、語料公共服務(wù)平臺,上海為大模型基礎(chǔ)底座賦能http://m.lensthegame.com/show-11-16911-0.html

          聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。

          上一篇: 人氣超ChatGPT的“東方力量”,DeepSeek強(qiáng)在哪?

          下一篇: 上海專家在頂刊發(fā)文,為益生菌減肥降糖添新證

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 国产aⅴ精品一区二区三区久久| 精品无码中出一区二区| 一区二区三区在线| 亚洲精品色播一区二区| 国产香蕉一区二区三区在线视频 | 亚洲福利视频一区二区三区| 色婷婷一区二区三区四区成人网 | V一区无码内射国产| 国产精品丝袜一区二区三区 | 2014AV天堂无码一区| 色偷偷一区二区无码视频| 韩国女主播一区二区| 精品福利一区二区三区精品国产第一国产综合精品 | 精品国产亚洲一区二区三区 | 性色AV 一区二区三区| 中文字幕乱码一区二区免费| 亚洲欧美日韩中文字幕一区二区三区 | 无码精品尤物一区二区三区| 波多野结衣中文一区二区免费| 波多野结衣高清一区二区三区| 国产美女一区二区三区| 日本夜爽爽一区二区三区| 97久久精品一区二区三区| 视频一区二区在线观看| 亚洲一区二区三区久久| 亚洲AV成人精品日韩一区18p| 少妇激情AV一区二区三区| 日韩有码一区二区| 伊人色综合视频一区二区三区| 国产伦精品一区二区三区视频猫咪| 乱子伦一区二区三区| 国产主播一区二区三区在线观看| 无码欧精品亚洲日韩一区| jizz免费一区二区三区| 毛片无码一区二区三区a片视频| 国产精品无码一区二区三区电影| 精品成人一区二区三区免费视频 | 日韩精品免费一区二区三区 | 国产成人一区二区三区视频免费| 国产精品伦子一区二区三区| 久久人做人爽一区二区三区|