各行各業(yè)的制造商都面臨著諸多方面的挑戰(zhàn),要雇傭并留住合格員工,要跟上技術(shù)創(chuàng)新的步伐,還要滿足客戶對(duì)于速度和精準(zhǔn)度的更高要求。對(duì)于汽車制造業(yè)而言,可持續(xù)性、運(yùn)營和供應(yīng)鏈的數(shù)字化、更高的安全要求以及對(duì)個(gè)性化的需求也成為其首要關(guān)注的問題。斑馬技術(shù)去年發(fā)布的《汽車生態(tài)系統(tǒng)愿景研究報(bào)告》顯示,73%的受訪行業(yè)決策者認(rèn)為,如果不采用更多的數(shù)字化技術(shù),他們的企業(yè)將處于競(jìng)爭(zhēng)劣勢(shì),其中“開發(fā)軟件專業(yè)知識(shí)”被列為決策者的前五大優(yōu)先投資選項(xiàng)之一。麥肯錫發(fā)布的報(bào)告也認(rèn)同這一觀點(diǎn),稱在機(jī)器人技術(shù)、AI和機(jī)器學(xué)習(xí)方面的最新發(fā)展使我們處于新自動(dòng)化時(shí)代的前沿。
機(jī)器視覺作為工業(yè)之“眼”,適用于數(shù)據(jù)采集、識(shí)別和檢測(cè)等制造流程,隨著中國制造業(yè)用工成本的提高,機(jī)器視覺成為推動(dòng)數(shù)字經(jīng)濟(jì)時(shí)代制造業(yè)發(fā)展的重要技術(shù);此外,深度學(xué)習(xí)融入機(jī)器視覺算法也將驅(qū)動(dòng)制造業(yè)的智能化升級(jí)。其中深度學(xué)習(xí)光學(xué)字符識(shí)別(OCR)軟件便是一項(xiàng)重要的技術(shù)創(chuàng)新。根據(jù)斑馬技術(shù)的《汽車生態(tài)系統(tǒng)愿景研究報(bào)告》,汽車OEM(原始設(shè)備制造商)決策者認(rèn)為,對(duì)比2022年,預(yù)計(jì)2027年工業(yè)級(jí)機(jī)器視覺的使用率將增長83%。
深度學(xué)習(xí)與OCR的結(jié)合能夠滿足制造業(yè)在合規(guī)性、質(zhì)量和存在性檢測(cè)方面對(duì)速度、準(zhǔn)確度、以及可靠解決方案的需求。汽車、制藥、電子和食品飲料行業(yè)的運(yùn)營領(lǐng)導(dǎo)者通過深度學(xué)習(xí)OCR獲得的收益更為顯著。
深度學(xué)習(xí)OCR賦能智能制造
機(jī)器視覺和深度學(xué)習(xí)OCR正在推動(dòng)智能制造的發(fā)展,Gartner將智能制造定義為在工廠內(nèi)部以及其他供應(yīng)鏈職能部門之間協(xié)調(diào)物理和數(shù)字化流程的概念,這轉(zhuǎn)變了人員、流程和技術(shù)的運(yùn)作方式,并提供了可提升決策質(zhì)量、效率、成本和敏捷性所需的信息。換言之,通過深度學(xué)習(xí)和OCR實(shí)現(xiàn)制造業(yè)的自動(dòng)化,有助于從硬件、軟件和人員方面獲得效益。
但要進(jìn)行準(zhǔn)確的OCR檢驗(yàn)卻頗具挑戰(zhàn),風(fēng)格化的字體,模糊、扭曲或被遮擋的字符,反光的物體表面以及復(fù)雜、不均勻的背景,都可能使傳統(tǒng)OCR技術(shù)無法實(shí)現(xiàn)穩(wěn)定識(shí)別。所幸的是市場(chǎng)上已經(jīng)有新工具面世,它們具備工業(yè)級(jí)深度學(xué)習(xí)OCR功能,并附帶基于數(shù)千種不同圖像樣本進(jìn)行預(yù)訓(xùn)練的即用型神經(jīng)網(wǎng)絡(luò),這一系列新工具能夠開箱即用,即使在處理非常復(fù)雜的情況時(shí)也可以確保高準(zhǔn)確性。
這意味著在汽車制造環(huán)境中,深度學(xué)習(xí)OCR解決方案可以準(zhǔn)確地讀取電池、輪胎、零部件和配件上噴印、壓印、以及啞光和金屬質(zhì)地的序列號(hào),以確保其與正確車型的車輛識(shí)別號(hào)(VIN)相對(duì)應(yīng)。這些解決方案還可以應(yīng)對(duì)各種字體樣式和大小,并適用于不斷變化且“嚴(yán)苛”的照明及制造環(huán)境。
深度學(xué)習(xí)OCR還可以用作更廣泛的機(jī)器視覺解決方案的一部分。例如,在汽車制造環(huán)境中,可以通過部署機(jī)器視覺解決方案,檢查連接器針腳是否缺失及其質(zhì)量和合規(guī)性是否達(dá)標(biāo),也可以對(duì)印刷電路板上的敷形涂層、粘合劑檢驗(yàn)、線束組裝、電池極性以及總裝等進(jìn)行檢驗(yàn)。
在這些場(chǎng)景中,使用相同的機(jī)器視覺相機(jī)和統(tǒng)一軟件平臺(tái)部署的機(jī)器視覺解決方案能夠以更快的速度檢驗(yàn)物品,標(biāo)記出疑似缺陷和錯(cuò)誤供工程師檢查并判定是否為故障,以進(jìn)一步處理。審查決策將被反饋到神經(jīng)網(wǎng)絡(luò)中,有助于保持持續(xù)學(xué)習(xí)輸入的活躍狀態(tài),從而進(jìn)一步開發(fā)和增強(qiáng)模型。這優(yōu)化了效率,并為工程師免去了一項(xiàng)重要卻繁瑣的手動(dòng)任務(wù)。
日益增長的深度學(xué)習(xí)價(jià)值
深度學(xué)習(xí)的速度和準(zhǔn)確性使其能夠更好地幫助工程師確保生產(chǎn)制造的質(zhì)量,控制生產(chǎn)成本并提高客戶滿意度。此外,易用性也同樣重要,而這正是深度學(xué)習(xí)OCR軟件的優(yōu)勢(shì)所在,它是一種易于實(shí)施和使用的應(yīng)用,無需機(jī)器視覺專業(yè)知識(shí),只需幾個(gè)簡單的步驟即可部署。
總的來說,更易于獲取和使用的機(jī)器視覺和深度學(xué)習(xí)OCR解決方案為工業(yè)成像專業(yè)人員和工程師解鎖了新的可能性,使他們能夠更像數(shù)據(jù)科學(xué)家一樣思考和行動(dòng)。面對(duì)不斷增長的數(shù)據(jù)生成速度、數(shù)據(jù)量和數(shù)據(jù)多樣性,以及對(duì)于生產(chǎn)速度、安全性和準(zhǔn)確性等更高水平的要求,我們相信這一技術(shù)發(fā)展是必要的,也是業(yè)界所樂見的。
更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<