AI大模型驅(qū)動(dòng)周期演進(jìn)加速 3D視覺感知打開機(jī)會(huì)空間
AI大模型驅(qū)動(dòng)下,從投資人到產(chǎn)業(yè)界都在思索由此帶來的沖擊和機(jī)會(huì)。因其逐漸有了“智能涌現(xiàn)”能力,產(chǎn)業(yè)鏈方如何承接這些技術(shù)賦能,投入節(jié)點(diǎn)選擇也變得重要。
“投資人這幾年一大主題就是AI。”一村淞靈投資總經(jīng)理張晨對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,“通過對(duì)AI方向的積累學(xué)習(xí),我們公司形成了生態(tài)打法:在感知周期時(shí),重視對(duì)AI視覺、觸覺、嗅覺、類腦領(lǐng)域布局;現(xiàn)在是模型周期,未來會(huì)走向行為周期。無論是哪一個(gè)AI周期發(fā)展階段,我們堅(jiān)定看好中國的產(chǎn)業(yè)發(fā)展。”
除了偏向于自然語言側(cè)的ChatGPT外,2023年Meta發(fā)布了旗下圖像類AI大模型SAM(Segment Anything Model)。據(jù)介紹,這是一種用于圖像分割的基礎(chǔ)模型,可以在無需額外訓(xùn)練、零樣本泛化前提下,實(shí)現(xiàn)辨別物體、對(duì)圖像的理解能力。業(yè)界認(rèn)為由此開啟了機(jī)器視覺的GPT時(shí)刻,將推動(dòng)跨視覺模態(tài)的場(chǎng)景應(yīng)用,如自動(dòng)駕駛、安防監(jiān)控等。
“在去年(2023年)上半年我還有一些顧慮甚至危機(jī)感:當(dāng)AI厲害到輸入什么數(shù)據(jù)都能得到很好的效果,是否可能就不需要我們3D感知行業(yè)了?”光鑒科技創(chuàng)始人兼CEO朱力對(duì)記者分析,“但通過與硅谷業(yè)內(nèi)交流,我們的一致結(jié)論是:其一,AI很依賴數(shù)據(jù)來源,如果輸入的數(shù)據(jù)很差就會(huì)導(dǎo)致輸出結(jié)果不好,因此好的傳感器很有價(jià)值;其二,AI最終需要計(jì)算也要考慮到成本,在傳感器和算力之間尋求平衡很重要,目前階段行業(yè)是在把感知能力做強(qiáng),再拓展應(yīng)用的階段。”
生成式AI的出現(xiàn),令A(yù)I不同發(fā)展周期的時(shí)長在縮短,也驅(qū)動(dòng)產(chǎn)業(yè)鏈演進(jìn)落地打開新空間,但同時(shí)快速迭代也會(huì)吞沒一些既有能力布局,考驗(yàn)著產(chǎn)業(yè)鏈的思索。
AI驅(qū)動(dòng)演變
如果說AI大模型類似于進(jìn)行運(yùn)算的大腦,要支持大腦運(yùn)轉(zhuǎn)需要足夠充足的觸角和養(yǎng)料,因此圍繞AI感知側(cè)的相關(guān)產(chǎn)業(yè)鏈發(fā)展成長就殊為重要。
天風(fēng)證券就指出,看好3D視覺通過與AI更緊密地結(jié)合有望實(shí)現(xiàn)更高效的智能感知和控制系統(tǒng)。通過將深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、大語言模型等AI技術(shù)應(yīng)用于3D視覺感知,可實(shí)現(xiàn)更高效的數(shù)據(jù)處理、特征提取和模式識(shí)別。
張晨對(duì)記者分析,在其定義的AI發(fā)展三個(gè)周期中,AI的感知周期階段,主要是通過感知外部環(huán)境來豐富具身智能所需相關(guān)信息,如視覺、嗅覺、類腦等,核心是解決信息獲取問題;在模型周期主要解決機(jī)器思考和決策問題的過程;行為周期則可能是出現(xiàn)人類目前認(rèn)知無法達(dá)到的應(yīng)用。
SAM模型的出現(xiàn),是對(duì)以圖形、視覺為基礎(chǔ)的產(chǎn)業(yè)鏈應(yīng)用打開新空間。
“現(xiàn)在來看,模型周期的發(fā)展進(jìn)程在縮短,比如研究多模態(tài)融合,如果在2021年早期投資機(jī)構(gòu)不布局,后續(xù)可能就沒有機(jī)會(huì)了。因?yàn)锳I發(fā)展速度太快,幾乎每周都要知識(shí)更新。”張晨感慨,目前AI行業(yè)已進(jìn)入模型周期,當(dāng)前出現(xiàn)了基礎(chǔ)大模型和行業(yè)大模型不同類型,在大模型應(yīng)用階段,會(huì)出現(xiàn)諸多投資機(jī)會(huì)。
在這一邏輯下,一村淞靈面向感知周期,在早期就開始參與投資3D視覺領(lǐng)域領(lǐng)先公司光鑒科技。
朱力曾是蘋果公司3D傳感項(xiàng)目負(fù)責(zé)人,在發(fā)掘該細(xì)分領(lǐng)域成長空間后選擇歸國創(chuàng)業(yè)。他對(duì)記者表示,3D視覺傳感意味著提升機(jī)器的感知能力,構(gòu)建X-Y-Z空間坐標(biāo),相較于2D視覺,3D視覺主要為機(jī)器算法服務(wù),更加精準(zhǔn)和安全,也具備更強(qiáng)的隱私性,可以為人工智能帶來更優(yōu)秀的感知能力。
“AI大模型出現(xiàn),將機(jī)器原有能力進(jìn)行了擴(kuò)充。舉例來說,此前設(shè)計(jì)家用掃地機(jī)器人時(shí),避障功能通常需要植入多種分類模型才能有較好表現(xiàn),但有了通用大模型后,用一個(gè)模型就可以讓機(jī)器智能化快速提升。”
因此對(duì)視覺傳感行業(yè)而言,AI大模型出現(xiàn)可以驅(qū)動(dòng)產(chǎn)品更加完整,進(jìn)而促進(jìn)AI相關(guān)軟硬件的規(guī)模化應(yīng)用。SAM模型則主要解決了感知層的通用性問題,讓空間傳感信息轉(zhuǎn)化成自然語言處理的過程更加高效。“坦率說,大多數(shù)應(yīng)用型公司很難做到自己搭建一個(gè)基礎(chǔ)大模型,但是通過引入這種底層能力,在一些垂直應(yīng)用上嵌入我們的數(shù)據(jù)進(jìn)行微調(diào),可以帶來差異化價(jià)值。”他進(jìn)一步指出。
“當(dāng)然在大模型應(yīng)用中,我們還處在偏應(yīng)用端,不用操之過急很早參與進(jìn)去。”朱力表示,可以成為大模型的應(yīng)用參與者,探索其中新方向,但當(dāng)前還沒必要對(duì)大模型本身過早投入,例如微調(diào)等動(dòng)作。因?yàn)楹苡锌赡苣壳罢谧龅氖虑椋瑤讉€(gè)月后就會(huì)被Open AI的功能升級(jí)所抵消,抓住自身垂直場(chǎng)景的核心環(huán)節(jié)很關(guān)鍵。
感知側(cè)路線圖
面對(duì)涌動(dòng)的AI浪潮,產(chǎn)業(yè)鏈廠商的技術(shù)和應(yīng)用路線圖也在逐漸拓維。
“我不斷在思考。視覺感知幾乎與智能相關(guān)的行業(yè)都沾邊,選擇做什么,首先要定位在價(jià)值鏈條中創(chuàng)造的是什么。”朱力分析,因?yàn)楫?dāng)前現(xiàn)實(shí)生活中的人工智能應(yīng)用,有85%以上信息來自視覺信息。光鑒科技的目標(biāo)是通過視覺能力,解決智能設(shè)備和人、空間之間的交互問題。
手機(jī)端是最早把3D視覺行業(yè)推向拐點(diǎn)的應(yīng)用,蘋果在iPhoneX中率先應(yīng)用Face ID后讓供應(yīng)鏈成本快速降低,才有了在其他行業(yè)進(jìn)一步探索應(yīng)用的可能性。
“2023年有一個(gè)明顯趨勢(shì),多家國內(nèi)手機(jī)大廠在旗艦手機(jī)中專門配置安全芯片,在這方面3D視覺會(huì)比2D視覺有更大優(yōu)勢(shì),且旗艦手機(jī)的成本空間相對(duì)高,3D視覺應(yīng)用落地會(huì)有更大想象空間。”朱力對(duì)記者分析。
從量級(jí)看,即便手機(jī)行業(yè)目前走到一定瓶頸發(fā)展期,但依然是一個(gè)十多億臺(tái)體量的大市場(chǎng),對(duì)于供應(yīng)鏈企業(yè)來說,即便只應(yīng)用在10%手機(jī)中,也是上億臺(tái)手機(jī)的發(fā)展空間。
生物識(shí)別場(chǎng)景除手機(jī)外,支付也是一個(gè)快速成長的市場(chǎng)。“刷臉支付是我們前幾年投入的方向,刷掌支付會(huì)是下一個(gè)趨勢(shì)。隨著產(chǎn)業(yè)界的推動(dòng),在信息安全保護(hù)相對(duì)謹(jǐn)慎的歐美國家也認(rèn)可了這種生物識(shí)別支付方式,相比于用戶可能擔(dān)心人臉信息涉及隱私,刷掌支付被認(rèn)為是開放社會(huì)中生物識(shí)別的最佳形態(tài)。”他續(xù)稱。
在近些年沉沉浮浮的XR行業(yè),蘋果Vision Pro中內(nèi)置了不少光學(xué)器件,也會(huì)是3D傳感領(lǐng)域的一大機(jī)會(huì)。但即便在2024年蘋果將量產(chǎn)商用旗下產(chǎn)品,顯然目前這還不是消費(fèi)者能大規(guī)模接受的應(yīng)用終端。
朱力分析認(rèn)為,Vision Pro目前階段的重要使命,是提供給大量專業(yè)開發(fā)者建設(shè)應(yīng)用生態(tài)。正因XR行業(yè)當(dāng)前沒有出現(xiàn)殺手級(jí)應(yīng)用,行業(yè)拐點(diǎn)不會(huì)快速到來。“或許在2-3年后,行業(yè)對(duì)XR應(yīng)用趨勢(shì)達(dá)成共識(shí),同時(shí)其本身通過迭代優(yōu)化、成本快速下降,預(yù)計(jì)在2026年左右,可能會(huì)迎來市場(chǎng)真正需要的XR產(chǎn)品。”基于這一判斷,光鑒科技目前也在與創(chuàng)新產(chǎn)品公司合作,研發(fā)新的產(chǎn)品方案,但會(huì)謹(jǐn)慎地控制投入。
機(jī)器人和汽車是成長空間和天花板都很高的另外兩大終端市場(chǎng)。朱力分析,機(jī)器人市場(chǎng)能帶來相對(duì)較高的附加值;汽車市場(chǎng)則是伴隨國內(nèi)快速迭代必然會(huì)出現(xiàn)高需求,“我們目前在汽車市場(chǎng)會(huì)聚焦服務(wù)國內(nèi)2-3家客戶,先把產(chǎn)品打磨到足夠好,再考慮面向全球銷售產(chǎn)品。”
周期中尋路
智能汽車無疑是當(dāng)前視覺傳感產(chǎn)業(yè)鏈重要的落地驅(qū)動(dòng)之一。只是面對(duì)不同場(chǎng)景,整車廠可能會(huì)存在路線快速選擇和調(diào)整的過程。
朱力對(duì)記者分析,3D視覺傳感在智能汽車中的落地場(chǎng)景有兩類:智能駕駛、人機(jī)交互。目前智能駕駛相關(guān)應(yīng)用如輔助駕駛、自動(dòng)泊車等,以激光雷達(dá)類供應(yīng)商居多,但其偏高的成本意味著普遍應(yīng)用門檻較高。而人機(jī)交互在汽車智能化浪潮中也很關(guān)鍵,“那就類似智能手機(jī)和功能機(jī)的區(qū)別,是采用鍵盤還是屏幕交互,體驗(yàn)差異很大。”他續(xù)稱,該部分能力可以從既往消費(fèi)電子領(lǐng)域的積累中延伸而來,涉及汽車如何理解人發(fā)出的指令(隔空交互、手勢(shì)交互等)、如何理解車內(nèi)環(huán)境等。
“比如人進(jìn)入車內(nèi)后,座椅如何根據(jù)人員需求自動(dòng)調(diào)整,我們已經(jīng)可以交付這類方案。”朱力介紹,3D視覺可以解決一定隱私安全疑慮,比如車內(nèi)疲勞監(jiān)測(cè)場(chǎng)景,需要車內(nèi)配置攝像頭和算法,但3D視覺并非構(gòu)建圖像信息,而是空間信息,“哪怕最壞情況下,這些信息被黑客捕捉了,也并不了解這些信息背后是怎樣的影像。”
“我們認(rèn)為,3D視覺會(huì)是未來解決座艙內(nèi)人機(jī)交互的關(guān)鍵技術(shù),但我們還不會(huì)參與面向自動(dòng)駕駛的車外視覺感知。”朱力補(bǔ)充道,因?yàn)樽詣?dòng)駕駛市場(chǎng)內(nèi)卷嚴(yán)重,找準(zhǔn)可以實(shí)現(xiàn)商業(yè)閉環(huán)的切入點(diǎn)很重要,不能不計(jì)成本內(nèi)卷;同時(shí)伴隨大模型興起,自動(dòng)駕駛未來的發(fā)展路線將有很多變數(shù),既往架構(gòu)設(shè)計(jì)很可能會(huì)有重大變化,因此目前需要謹(jǐn)慎。
從產(chǎn)業(yè)發(fā)展歷程看,3D視覺傳感早期由美國和日本廠商探路發(fā)展模式并走向成熟,目前在國內(nèi)呈現(xiàn)產(chǎn)業(yè)鏈公司相對(duì)分散的局面。
張晨對(duì)記者分析,讓AI理解物理世界到底是什么樣子,是3D傳感產(chǎn)業(yè)鏈環(huán)節(jié)最主要的優(yōu)勢(shì),其也是向機(jī)器提供物理世界深度信息的關(guān)鍵紐帶。“我們覺得機(jī)器視覺度過了多輪經(jīng)濟(jì)周期變化,目前歐美日等市場(chǎng)找到了其細(xì)分領(lǐng)域發(fā)展規(guī)律,優(yōu)勢(shì)明顯。在這一方向,從技術(shù)到產(chǎn)品打磨、形成工程量產(chǎn),都需要積累、迭代、收獲反饋。在中國發(fā)展機(jī)器視覺、尤其3D視覺也要經(jīng)歷這些過程,才能找到規(guī)律。”
“消費(fèi)電子行業(yè)的特點(diǎn)是迭代快、周期短,但爆發(fā)力驚人。因此就需要?jiǎng)?chuàng)業(yè)團(tuán)隊(duì)具備敏銳的商業(yè)嗅覺,同時(shí)理解技術(shù)演進(jìn)趨勢(shì)。”他表示。
“3D視覺會(huì)是未來人工智能進(jìn)入人類生活的重要橋梁。”朱力總結(jié)道,當(dāng)前AI在生活中的滲透率越來越高,在需要人機(jī)交互的環(huán)節(jié),都將有廣闊發(fā)展空間。
(作者:駱軼琪)
本文鏈接:AI大模型驅(qū)動(dòng)周期演進(jìn)加速 3D視覺感知打開機(jī)會(huì)空間http://m.lensthegame.com/show-2-2261-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇: 嫦娥六號(hào)探測(cè)器運(yùn)抵中國文昌航天發(fā)射場(chǎng) 計(jì)劃今年上半年發(fā)射