科技發(fā)展日新月異,科技結(jié)合圖像處理的應(yīng)用案例雨后春筍般地冒出,甚至融入我們的日常生活,使生活質(zhì)量和效率大幅提升。本文就分享一些生活中的影像辨識應(yīng)用,剖析計算機(jī)視覺與開放原始碼的運(yùn)用以及其帶來的效益。
開源系統(tǒng)讓影像辨識成真
人腦在進(jìn)行影像辨識時,從眼睛接收圖像,到大腦計算,這個過程共需經(jīng)過七層關(guān)卡,其中包含影像亮度/色彩/邊界的擷取、可識別的對象的組合、大腦 30%~40% 的部位執(zhí)行視覺運(yùn)算與分析,最后才由大腦告訴你,這個影像是什么。
而關(guān)于計算機(jī)影像辨識,Intel 所發(fā)起的開源影像辨識系統(tǒng) OpenCV 便是不可或缺的主角。這套開源系統(tǒng)讓開發(fā)人員在進(jìn)行相關(guān)辨識系統(tǒng)的開發(fā)時更加容易,同時促進(jìn)相關(guān)技術(shù)的進(jìn)展。若計算機(jī)辨識系統(tǒng)要仿效人腦得到相近的視覺感受,則必須經(jīng)過復(fù)雜的運(yùn)算,以當(dāng)紅的虛擬現(xiàn)實(VR)、擴(kuò)增實境(AR)或是結(jié)合兩者的混合實境(MR)來說,都必須計算出影像中各個對象的運(yùn)動狀況、環(huán)境的影像復(fù)原和重建等。
計算機(jī)視覺系統(tǒng)基本架構(gòu)
OpenCV 可以在許多平臺上執(zhí)行,以Webduino 為例,其運(yùn)行Google Tensorflow.js后,讓硬件的開發(fā)者可以更簡單的使用網(wǎng)頁開發(fā)AI服務(wù)。這個云端平臺,整合了從硬件到軟件、軟件到云端、云端到行動裝置,充分展現(xiàn) OpenCV 跨平臺的能力!
將 OpenCV 結(jié)合攝影機(jī),擷取物體顏色,經(jīng)過設(shè)定特定色彩范圍后,OpenCV 也可以被來偵測熱區(qū)、對物體顏色進(jìn)行萃取,甚至能將這項影像辨識技術(shù)結(jié)合機(jī)械手臂,應(yīng)用在更多領(lǐng)域中。此外,這項技術(shù)也能夠在攝影鏡頭偵測到的指定對象上畫上笑臉,再利用 Google 大腦團(tuán)隊開發(fā)的 Tensorflow.js 進(jìn)行深度學(xué)習(xí),提升其偵測物體技術(shù)及準(zhǔn)確度。目前 Webduino也正將這些程序信息整合成一個平臺,在瀏覽器上就能直接進(jìn)行對象的分類及偵測。
Webduino 示意圖
另外一個應(yīng)用是農(nóng)業(yè)。在一望無際的西紅柿園里,果實的顏色與大小總是參差不齊,通過設(shè)計蜂巢農(nóng)研影像,利用 OpenCV 和 YOLO 進(jìn)行物體檢測,將偵測到的西紅柿果實進(jìn)行框架并標(biāo)示,以作為自動采收系統(tǒng)中的視覺模塊核心。經(jīng)過開發(fā)者不斷地嘗試與檢測、調(diào)整程序,這套物體偵測系統(tǒng)能增快篩選速度并減輕人力負(fù)擔(dān),有效提升工作效率!
UGV 西紅柿采收項目中的物體偵測
車牌辨識知多少?
影像辨識技術(shù)日趨成熟,應(yīng)用領(lǐng)域也更為廣泛。在車牌辨識系統(tǒng)領(lǐng)域中,由于攝影機(jī)質(zhì)量大幅躍升,現(xiàn)在已經(jīng)進(jìn)入車牌辨識乃至影像辨識的戰(zhàn)國時代!傳統(tǒng) 2D 平面辨識系統(tǒng),辨識度低且分析速度慢,而最新研發(fā)的 3D 立體辨識系統(tǒng)篩選速度快,即使畫面中傾斜的車牌號碼也能清楚掌握。
為了追求更高的效率,設(shè)計者不斷嘗試讓系統(tǒng)能一次偵測「多車」的辨識程序。目前 3D 立體辨識系統(tǒng)已能在相同時間內(nèi),辨識出多個車牌,并普遍應(yīng)用在壓線拍照的停車場、學(xué)校小區(qū)的柵欄感應(yīng)辨識、測速的高畫素多車偵測、辨識側(cè)邊路旁車牌的車載等領(lǐng)域。未來,若車牌辨識技術(shù)結(jié)合超高清(Ultra HD)攝影機(jī),將賦予講究效率和質(zhì)量的「動態(tài)、多車、多車道」辨識系統(tǒng),達(dá)到能夠運(yùn)用到更廣泛的生活層面。
影像辨識結(jié)合醫(yī)療
為了解決偏鄉(xiāng)長者對于藥物服用、辨別較不熟悉的問題,已經(jīng)有團(tuán)隊研發(fā)出 AI 自動給藥系統(tǒng)— UTOPIL,設(shè)計團(tuán)隊以長者最常服用的 15 種藥物進(jìn)行辨識實驗,辨識結(jié)果正確率高達(dá)99.1%!
起初設(shè)計團(tuán)隊利用機(jī)械手臂來旋轉(zhuǎn)藥物,進(jìn)行多角度拍攝,擷取藥物影像。如此作法雖然提升實驗速度,機(jī)械手臂卻經(jīng)常捏碎藥丸,甚至有污染的風(fēng)險,因此改以「真空吸取藥丸」的方式進(jìn)行辨識,如此一來,藥物的形狀大小也不會受限制,團(tuán)隊也將藥物辨識后的結(jié)果建立成數(shù)據(jù)庫,并依照長者需求,定時發(fā)放藥物供長者服用,以達(dá)到按時吃藥、吃對藥物的目的。
這樣一個有系統(tǒng)性的藥物辨識技術(shù),除了能協(xié)助居家長者服藥,未來也盼能協(xié)助藥局快速分藥,或在鄉(xiāng)里間公共場所定期提供給藥服務(wù),讓影像辨識技術(shù)發(fā)揮最大效益,造福更多人群。
小結(jié)
從身邊的 iPhone X 所搭載的臉部辨識系統(tǒng),到隨處可見的車牌辨識,影像辨識技術(shù)已融入我們的日常生活。為了應(yīng)用在不同的場景,影像辨識所著重的技術(shù)重點(diǎn)也各不相同,藉由結(jié)合特殊的算法,或其他硬件輔助,便能快速應(yīng)用在不同領(lǐng)域,以協(xié)助改善人類生活,讓生活質(zhì)量大幅提升。相信未來的影像辨識應(yīng)用將會更加寬廣,讓辨識算法更加精進(jìn)、使影像辨識技術(shù)更上一層樓。