“能打字就能做視頻”，智象多模態(tài)大模型升級

2024-12-31 10:19:08 來源：中國科學(xué)報

觀看：104

12月28日，安徽人工智能產(chǎn)業(yè)先導(dǎo)區(qū)啟動活動在合肥舉行，智象未來科技有限公司（以下簡稱智象未來）作為安徽人工智能產(chǎn)業(yè)先導(dǎo)區(qū)的零號入駐企業(yè)正式落地合肥。活動現(xiàn)場，智象未來正式發(fā)布智象多模態(tài)生成大模型3.0版。

梅濤介紹智象多模態(tài)生成大模型3.0 主辦方供圖

“智象多模態(tài)生成大模型3.0版全面升級圖像和視頻生成能力。”據(jù)智象未來創(chuàng)始人兼CEO梅濤介紹，具體包括畫面質(zhì)量與相關(guān)性提升、鏡頭運動和畫面運動更加可控以及多場景驅(qū)動優(yōu)化。同時，智象未來還發(fā)布了智象多模態(tài)理解大模型1.0版，其通過對物體級別的畫面建模、對事件級別的時空建模，更加準確、精細地理解圖像、視頻內(nèi)容。

在最新迭代的版本中，智象創(chuàng)作者平臺強化了與用戶的自然語言交互，致力于實現(xiàn)“能打字，就能做視頻”。據(jù)介紹，在原有文生視頻的基礎(chǔ)上，智象創(chuàng)作者平臺增加了對視頻局部進行語音指令輸入的調(diào)整，同時可基于用戶上傳的視頻內(nèi)容，整理成相關(guān)的模型輸出指令。這一功能將大大降低用戶使用AIGC工具編輯視頻的學(xué)習(xí)門檻。

成立于2023年的智象未來，在大模型研發(fā)、版權(quán)數(shù)據(jù)積累和商業(yè)化方面已有一定的發(fā)展：大模型研發(fā)方面，自主研發(fā)百億級參數(shù)的視頻生成大模型；在數(shù)據(jù)積累上，擁有數(shù)十萬個小時的版權(quán)視頻素材、上萬個授權(quán)IP，廣泛應(yīng)用于影視、文旅、通信、營銷、教育等場景；商業(yè)化方面，已累計服務(wù)100多個國家和地區(qū)的1000多萬個人用戶和4萬多家企業(yè)客戶。

智象未來的“掌門人”梅濤博士畢業(yè)于中國科技大學(xué)，曾在微軟亞洲研究院有著12年的工作履歷；2018年至2023年初，任京東集團副總裁、京東探索研究院副院長。目前為國際電氣和電子工程師協(xié)會（IEEE）和國際模式識別學(xué)會（IAPR）會士。梅濤在學(xué)術(shù)領(lǐng)域也成果豐碩，在多媒體分析和計算機視覺領(lǐng)域發(fā)表論文300多篇，先后15次榮獲最佳國際論文獎。

近期，智象未來也披露了其融資情況。繼完成敦鴻資本領(lǐng)投的Pre-A輪融資后，又新獲以合肥產(chǎn)投為主的國資基金領(lǐng)投的A輪融資，融資規(guī)模共計數(shù)億元。同時參投的還包括安徽省人工智能母基金和湖北省長江電影集團有限公司等機構(gòu)，此前曾獲阿爾法公社與訊飛兩輪領(lǐng)投。

據(jù)介紹，隨著多模態(tài)生成大模型3.0版的發(fā)布，智象未來旗下的創(chuàng)作工具平臺、互動營銷平臺、一站式視頻平臺也將為用戶帶來全新體驗。當天，智象未來與上海電影集團等12家生態(tài)伙伴企業(yè)代表簽約，旨在共同打造集技術(shù)研發(fā)、產(chǎn)業(yè)化應(yīng)用、市場推廣于一體的生態(tài)體系。

本文鏈接：“能打字就能做視頻”，智象多模態(tài)大模型升級http://m.lensthegame.com/show-11-15785-0.html

聲明：本網(wǎng)站為非營利性網(wǎng)站，本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻，不代表本站觀點，本站不承擔任何法律責任，僅提供存儲服務(wù)。天上不會到餡餅，請大家謹防詐騙！若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。

上一篇：奔赴大西北：點亮新疆農(nóng)業(yè)科技之光

下一篇：中廣核青海冷湖廣竣50萬千瓦風電項目全容量并網(wǎng)發(fā)電

“能打字就能做視頻”，智象多模態(tài)大模型升級

熱門資訊

推薦資訊

科學(xué)最熱文章