在安防領(lǐng)域,近年來深度學(xué)習(xí)的技術(shù),非常大的數(shù)據(jù)量和計算量可以擴張地使用,超過了我們的想象。同時我們也對人所謂的智力,當時有一些錯誤的幻想,實際上深度學(xué)習(xí)的成長非常的快速,它可以在安防領(lǐng)域得到非常好的應(yīng)用。
深度學(xué)習(xí)作為機器學(xué)習(xí)研究中的一個領(lǐng)域,其動機在于建立、模擬人腦進行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機制來解釋數(shù)據(jù),例如圖像、聲音和文本等。目前,深度學(xué)習(xí)的應(yīng)用領(lǐng)域中大約有70%都在圖像識別方面,結(jié)合安防領(lǐng)域的現(xiàn)狀,這就意味著,深度學(xué)習(xí)在這一領(lǐng)域必然會有顛覆性的發(fā)展。隨著大數(shù)據(jù)與高清攝像機應(yīng)用的普及,安防大數(shù)據(jù)時代已經(jīng)到來,海量高清及以上分辨率視頻數(shù)據(jù)給安防產(chǎn)品技術(shù)帶來了大數(shù)據(jù),這也就成為深度學(xué)習(xí)在安防領(lǐng)域必將快速發(fā)展的肥沃土壤。
在安防行業(yè),涉及的數(shù)據(jù)信息類型越來越多。其中,99%以上的數(shù)據(jù),包括監(jiān)控視頻錄像、報警錄像、車輛卡口圖片、人臉抓拍圖片等都是非結(jié)構(gòu)化的,要想對這數(shù)據(jù)進行進一步分析,做到“數(shù)為人所用”,就需要將非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化。和以往的傳統(tǒng)智能算法相比,深度學(xué)習(xí)可以像人類大腦一樣搜集信息,并將這些信息轉(zhuǎn)化為相應(yīng)的行為,在解決視頻結(jié)構(gòu)化問題方面更“智能”。
在今年北京安博會開幕的前一天,??低暸e行了新品發(fā)布會,發(fā)布了基于深度學(xué)習(xí)技術(shù)的從前端到后端全系列智能安防產(chǎn)品,新品涵蓋“深眸”系列智能攝像機、“神捕”系列智能交通產(chǎn)品、“超腦”系列智能NVR、“臉譜”系列人臉分析服務(wù)器等。
宇視科技
和以往的傳統(tǒng)智能算法相比,深度學(xué)習(xí)可以像人類大腦一樣搜集信息,并將這些信息轉(zhuǎn)化為相應(yīng)的行為,在解決視頻結(jié)構(gòu)化問題方面更“智能”。
在安博會現(xiàn)場,宇視基于Movidius+NVIDIA芯片全球戰(zhàn)略首發(fā)的深度學(xué)習(xí)人臉識別攝像機、深度學(xué)習(xí)智能交通抓拍機、深度學(xué)習(xí)USB智能棒、“昆侖”結(jié)構(gòu)化智能分析服務(wù)器、智能存儲融合一體化設(shè)備等均有展示。
初看之下,深度學(xué)習(xí)似乎是一種萬能的方法,什么問題都能夠輕松解決,然而就深度學(xué)習(xí)的具體應(yīng)用而言,目前依然存在三大主要難題:第一是大數(shù)據(jù)標定的問題,深度學(xué)習(xí)領(lǐng)域的一句流行語——“誰掌握著數(shù)據(jù)誰就掌握著市場”,就充分地說明了這一點;第二是計算量過大的問題,在具體應(yīng)用中隨著數(shù)據(jù)和網(wǎng)路層次的增加,不僅訓(xùn)練花費的時間在大幅增加,測試時間也在增加,在具體應(yīng)用中很難實現(xiàn)前端化和實時化;第三是訓(xùn)練收斂問題,以在圖像識別中應(yīng)用最多的卷積神經(jīng)網(wǎng)絡(luò)(CNN)為例,目前已經(jīng)出現(xiàn)了幾百層的網(wǎng)絡(luò)結(jié)構(gòu),訓(xùn)練過程中一般采用梯度下降的方法,這一過程中如果層數(shù)過多,數(shù)據(jù)初始化不合理就很容易不收斂。