隨著AI大模型、多模態(tài)感知、深度學(xué)習(xí)等技術(shù)的突破,智能視覺技術(shù)已成為驅(qū)動(dòng)安防行業(yè)革新的核心引擎。據(jù)行業(yè)數(shù)據(jù)顯示,2023年中國AI安防市場規(guī)模已突破728億元,計(jì)算機(jī)視覺技術(shù)在人臉識別、行為分析、風(fēng)險(xiǎn)預(yù)測等場景中滲透率超60%。預(yù)計(jì)到2030年,全球3D監(jiān)控?cái)z像機(jī)的市場規(guī)模將達(dá)約7.92億美元,相對于2022年的市場規(guī)模,復(fù)合增長率將超20%。


在活動(dòng)上,芯明空間智能產(chǎn)品總監(jiān)劉億明博士分享了「空間智能芯片解鎖AI安防大模型:3D視覺與智能感知的革新實(shí)踐」主題演講,聚焦芯明在空間智能芯片領(lǐng)域的核心技術(shù)突破和在AI安防領(lǐng)域的創(chuàng)新應(yīng)用,探討如何通過智能感知技術(shù)重構(gòu)安防系統(tǒng)的智能,推動(dòng)AI安防從“看見”向“看懂”“預(yù)判”的質(zhì)變升級。
劉博士說:“多維度、缺乏前瞻性、缺乏主動(dòng)性等是目前AI安防應(yīng)用的痛點(diǎn),常見的解決途徑之一是采用Transformer構(gòu)架的視覺語言模型,而高性能的視覺語言模型正在變得越來越小型化。例如微軟的Florence-2 模型,其大小僅有0.7B,這就為在邊緣端用一顆芯片部署提供了可能性。”
芯明自研系列空間智能芯片是目前全球唯一單芯片集成芯片化實(shí)時(shí)3D立體視覺感知、AI(人工智能)、SLAM(實(shí)時(shí)定位建圖)的系統(tǒng)級芯片。其自帶的3D視覺處理器,可以在不增加算力和硬件復(fù)雜度的基礎(chǔ)上高效的為模型提供深度信息,極大的地提高小模型的理解力,泛化力和精準(zhǔn)度。
劉博士表示,搭載視覺語言模型的芯明空間智能單芯片解決方案能夠幫助客戶降低系統(tǒng)成本,更快實(shí)現(xiàn)量產(chǎn);更多的3D視覺數(shù)據(jù)信息,也能夠有效解決由于3D視覺數(shù)據(jù)集不足而造成的模型發(fā)展受限問題。此外,模型的發(fā)展同樣可以推動(dòng)更多的3D監(jiān)控部署,通過數(shù)據(jù)模型的相互推動(dòng),助力行業(yè)步入高速發(fā)展階段。
“可以預(yù)見,在不遠(yuǎn)的將來,越來越多的監(jiān)控系統(tǒng)將具備3D視覺能力,甚至成為主流和標(biāo)準(zhǔn),”劉博士說。