科技發(fā)展日新月異,科技結合圖像處理的應用案例雨后春筍般地冒出,甚至融入我們的日常生活,使生活質量和效率大幅提升。本文就分享一些生活中的影像辨識應用,剖析計算機視覺與開放原始碼的運用以及其帶來的效益。
開源系統(tǒng)讓影像辨識成真
人腦在進行影像辨識時,從眼睛接收圖像,到大腦計算,這個過程共需經過七層關卡,其中包含影像亮度/色彩/邊界的擷取、可識別的對象的組合、大腦 30%~40% 的部位執(zhí)行視覺運算與分析,最后才由大腦告訴你,這個影像是什么。
而關于計算機影像辨識,Intel 所發(fā)起的開源影像辨識系統(tǒng) OpenCV 便是不可或缺的主角。這套開源系統(tǒng)讓開發(fā)人員在進行相關辨識系統(tǒng)的開發(fā)時更加容易,同時促進相關技術的進展。若計算機辨識系統(tǒng)要仿效人腦得到相近的視覺感受,則必須經過復雜的運算,以當紅的虛擬現(xiàn)實(VR)、擴增實境(AR)或是結合兩者的混合實境(MR)來說,都必須計算出影像中各個對象的運動狀況、環(huán)境的影像復原和重建等。
計算機視覺系統(tǒng)基本架構
OpenCV 可以在許多平臺上執(zhí)行,以Webduino 為例,其運行Google Tensorflow.js后,讓硬件的開發(fā)者可以更簡單的使用網頁開發(fā)AI服務。這個云端平臺,整合了從硬件到軟件、軟件到云端、云端到行動裝置,充分展現(xiàn) OpenCV 跨平臺的能力!
將 OpenCV 結合攝影機,擷取物體顏色,經過設定特定色彩范圍后,OpenCV 也可以被來偵測熱區(qū)、對物體顏色進行萃取,甚至能將這項影像辨識技術結合機械手臂,應用在更多領域中。此外,這項技術也能夠在攝影鏡頭偵測到的指定對象上畫上笑臉,再利用 Google 大腦團隊開發(fā)的 Tensorflow.js 進行深度學習,提升其偵測物體技術及準確度。目前 Webduino也正將這些程序信息整合成一個平臺,在瀏覽器上就能直接進行對象的分類及偵測。
Webduino 示意圖
另外一個應用是農業(yè)。在一望無際的西紅柿園里,果實的顏色與大小總是參差不齊,通過設計蜂巢農研影像,利用 OpenCV 和 YOLO 進行物體檢測,將偵測到的西紅柿果實進行框架并標示,以作為自動采收系統(tǒng)中的視覺模塊核心。經過開發(fā)者不斷地嘗試與檢測、調整程序,這套物體偵測系統(tǒng)能增快篩選速度并減輕人力負擔,有效提升工作效率!
UGV 西紅柿采收項目中的物體偵測
車牌辨識知多少?
影像辨識技術日趨成熟,應用領域也更為廣泛。在車牌辨識系統(tǒng)領域中,由于攝影機質量大幅躍升,現(xiàn)在已經進入車牌辨識乃至影像辨識的戰(zhàn)國時代!傳統(tǒng) 2D 平面辨識系統(tǒng),辨識度低且分析速度慢,而最新研發(fā)的 3D 立體辨識系統(tǒng)篩選速度快,即使畫面中傾斜的車牌號碼也能清楚掌握。
為了追求更高的效率,設計者不斷嘗試讓系統(tǒng)能一次偵測「多車」的辨識程序。目前 3D 立體辨識系統(tǒng)已能在相同時間內,辨識出多個車牌,并普遍應用在壓線拍照的停車場、學校小區(qū)的柵欄感應辨識、測速的高畫素多車偵測、辨識側邊路旁車牌的車載等領域。未來,若車牌辨識技術結合超高清(Ultra HD)攝影機,將賦予講究效率和質量的「動態(tài)、多車、多車道」辨識系統(tǒng),達到能夠運用到更廣泛的生活層面。
影像辨識結合醫(yī)療
為了解決偏鄉(xiāng)長者對于藥物服用、辨別較不熟悉的問題,已經有團隊研發(fā)出 AI 自動給藥系統(tǒng)— UTOPIL,設計團隊以長者最常服用的 15 種藥物進行辨識實驗,辨識結果正確率高達99.1%!
起初設計團隊利用機械手臂來旋轉藥物,進行多角度拍攝,擷取藥物影像。如此作法雖然提升實驗速度,機械手臂卻經常捏碎藥丸,甚至有污染的風險,因此改以「真空吸取藥丸」的方式進行辨識,如此一來,藥物的形狀大小也不會受限制,團隊也將藥物辨識后的結果建立成數據庫,并依照長者需求,定時發(fā)放藥物供長者服用,以達到按時吃藥、吃對藥物的目的。
這樣一個有系統(tǒng)性的藥物辨識技術,除了能協(xié)助居家長者服藥,未來也盼能協(xié)助藥局快速分藥,或在鄉(xiāng)里間公共場所定期提供給藥服務,讓影像辨識技術發(fā)揮最大效益,造福更多人群。
小結
從身邊的 iPhone X 所搭載的臉部辨識系統(tǒng),到隨處可見的車牌辨識,影像辨識技術已融入我們的日常生活。為了應用在不同的場景,影像辨識所著重的技術重點也各不相同,藉由結合特殊的算法,或其他硬件輔助,便能快速應用在不同領域,以協(xié)助改善人類生活,讓生活質量大幅提升。相信未來的影像辨識應用將會更加寬廣,讓辨識算法更加精進、使影像辨識技術更上一層樓。