近日,來自瑞士聯(lián)邦理工學(xué)院的一組研究人員在美國(guó)光學(xué)學(xué)會(huì)的高影響因子期刊 Optica 上發(fā)表文章報(bào)告其研究成果。他們利用深度神經(jīng)網(wǎng)絡(luò)對(duì)經(jīng)過多模光纖傳輸的數(shù)字圖像進(jìn)行精確重建,在長(zhǎng)達(dá)一公里的光纖上實(shí)現(xiàn)了 90% 的準(zhǔn)確率。圖像經(jīng)過光纖傳輸后輸出的是散斑圖,人眼無法辨認(rèn)其內(nèi)容,該研究小組利用深度神經(jīng)網(wǎng)絡(luò)模仿人腦學(xué)習(xí)過程,把模糊難認(rèn)的散斑圖轉(zhuǎn)換成可識(shí)別的數(shù)字圖像,該神經(jīng)網(wǎng)絡(luò)還能夠處理因環(huán)境對(duì)光纖的擾動(dòng)而造成的失真。該研究有望改進(jìn)內(nèi)窺鏡成像等醫(yī)療程序和通信應(yīng)用。
多模光纖輸出的圖像散斑圖(speckle pattern)輸入到深度神經(jīng)網(wǎng)絡(luò)的隱藏層,并被重建為數(shù)字 3。(圖源:Demetri Psaltis, Swiss Federal Institute of Technology Lausanne)
一個(gè)研究小組創(chuàng)造性地使用神經(jīng)網(wǎng)絡(luò)來模擬人腦處理圖像的過程,并且報(bào)告了其對(duì)在長(zhǎng)達(dá)一公里的光纖上傳輸?shù)膱D像進(jìn)行精確重建的研究工作。
研究人員在美國(guó)光學(xué)學(xué)會(huì)(OSA)高影響因子期刊「Optica」上報(bào)告了他們的研究,他們訓(xùn)練一種被稱為深度神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法,基于數(shù)字圖像傳輸?shù)焦饫w遠(yuǎn)端所生成的散斑圖來重建數(shù)字圖像。該研究可以改進(jìn)用于醫(yī)學(xué)診斷的內(nèi)窺鏡成像,提高光纖通信網(wǎng)絡(luò)的承載信息量,或者提高光纖的光功率。
瑞士聯(lián)邦理工學(xué)院的 Demetri Psaltis 稱:「我們使用現(xiàn)代深度神經(jīng)網(wǎng)絡(luò)架構(gòu)從光纖的雜亂輸出中檢索出輸入圖像?!顾c同事 Christophe Moser 一同領(lǐng)導(dǎo)了這項(xiàng)研究。他補(bǔ)充道:「我們證明了,在長(zhǎng)達(dá) 1 公里的光纖上完成這個(gè)過程是可能的?!共⑶覍⒃摴ぷ鞣Q作「一個(gè)重要的里程碑」。
解碼模糊圖案
光纖通過光傳輸信息。多模光纖比單模光纖具有更強(qiáng)的信息傳輸能力。它們具有許多通道(被稱為空間模式,因?yàn)樗鼈兙哂胁煌目臻g形狀),這些通道可以同時(shí)傳輸不同的信息流。
盡管多模光纖非常適合傳輸基于光的信號(hào),但要用它傳輸圖像還存在一些問題。來自圖像的光穿過所有的通道后,從另一端傳出的是一種人眼無法解碼的散斑圖。
為了解決這個(gè)問題,Psaltis 和他的團(tuán)隊(duì)決定使用深度神經(jīng)網(wǎng)絡(luò),這是一種運(yùn)作方式與人腦類似的機(jī)器學(xué)習(xí)算法。深度神經(jīng)網(wǎng)絡(luò)可以賦予計(jì)算機(jī)識(shí)別圖像中物體的能力,還能幫助改進(jìn)語音識(shí)別系統(tǒng)。輸入數(shù)據(jù)通過幾層人工神經(jīng)元進(jìn)行處理,每層神經(jīng)元在進(jìn)行一個(gè)小運(yùn)算后將結(jié)果傳遞給下一層神經(jīng)元。機(jī)器通過識(shí)別與輸入相關(guān)的輸出模式來學(xué)習(xí)識(shí)別輸入圖像。
參與該項(xiàng)目的博士生 Eirini Kakkava 解釋道:「如果我們思考一下神經(jīng)網(wǎng)絡(luò)的起源(即人腦),就會(huì)發(fā)現(xiàn)它的工作機(jī)制很簡(jiǎn)單。當(dāng)一個(gè)人盯著一個(gè)物體看的時(shí)候,大腦中的神經(jīng)元就會(huì)被激活,這個(gè)過程表示對(duì)一個(gè)熟悉的物體進(jìn)行識(shí)別。我們的大腦之所以能夠做到這一點(diǎn),是因?yàn)樗谖覀兊纳钪袝?huì)接受同一類物體的圖像或信號(hào)的訓(xùn)練,這改變了神經(jīng)元之間連接的強(qiáng)度?!篂榱擞?xùn)練一個(gè)人工神經(jīng)網(wǎng)絡(luò),研究人員基本上遵循相同的處理過程,教會(huì)神經(jīng)網(wǎng)絡(luò)識(shí)別某些圖像(在本文中指手寫數(shù)字),直到它能夠識(shí)別之前從未見過、但與訓(xùn)練圖像屬于同一類別的圖像。
從數(shù)字中學(xué)習(xí)
為了訓(xùn)練系統(tǒng),研究人員使用了一個(gè)包含 20000 個(gè)手寫數(shù)字樣本的數(shù)據(jù)庫,所有樣本是 0-9 的數(shù)字。他們選擇了其中的 16000 個(gè)樣本作為訓(xùn)練數(shù)據(jù),留出 2000 個(gè)樣本作為驗(yàn)證集,剩下的 2000 個(gè)樣本則用來測(cè)試已驗(yàn)證的系統(tǒng)。他們用激光照射每一個(gè)數(shù)字,并且將光束通過大約有 4500 個(gè)通道的光纖傳輸?shù)竭h(yuǎn)端的相機(jī)上。他們用一臺(tái)計(jì)算機(jī)測(cè)量輸出光的強(qiáng)度是如何在捕獲到的圖像中變化的。他們?yōu)槊總€(gè)數(shù)字收集了一系列實(shí)例。
盡管為每個(gè)數(shù)字收集的散斑圖對(duì)人眼來說都差不多,但神經(jīng)網(wǎng)絡(luò)能夠辨別出其中的細(xì)微差異,并識(shí)別出與每個(gè)數(shù)字相關(guān)的光強(qiáng)度模式。測(cè)試表明,該算法對(duì)在 0.1 米長(zhǎng)的光纖中傳輸?shù)膱D像達(dá)到了 97.6% 的識(shí)別準(zhǔn)確率,在 1 公里長(zhǎng)的光纖中達(dá)到了 90% 的識(shí)別準(zhǔn)確率。
這是一種更簡(jiǎn)單的方法
研究小組的另一位成員 Navid Borhani 說,與其它需要對(duì)輸出進(jìn)行全息測(cè)量的方法相比,這種機(jī)器學(xué)習(xí)方法能夠更簡(jiǎn)單地重建通過光纖傳輸?shù)膱D像。該神經(jīng)網(wǎng)絡(luò)還能夠處理因環(huán)境對(duì)光纖的擾動(dòng)而造成的失真,例如溫度波動(dòng)或氣流引起的光纖移動(dòng),這些擾動(dòng)會(huì)增加圖像的噪聲,而這種情況會(huì)隨著纖維長(zhǎng)度的增加而變得更糟。
Psatis 表示:「深度神經(jīng)網(wǎng)絡(luò)具備檢索通過多模光纖傳輸?shù)男畔⒌淖吭侥芰?,這將有利于內(nèi)窺鏡成像等醫(yī)療過程和通信應(yīng)用?!雇ㄐ判盘?hào)通常需要穿越若干公里的光纖,并且可能失真,而他們的這項(xiàng)技術(shù)可以修正這一現(xiàn)象。醫(yī)生可以使用超薄光纖探針收集人體內(nèi)的神經(jīng)束和動(dòng)脈圖像,無需復(fù)雜的全息記錄儀,也不用擔(dān)心操作時(shí)移動(dòng)幅度過大。Psatis 說:「呼吸或血液循環(huán)造成的微小運(yùn)動(dòng)會(huì)導(dǎo)致通過多模光纖傳輸?shù)膱D像失真。」而他們創(chuàng)建的深度神經(jīng)網(wǎng)絡(luò)方法是處理這種噪聲的高效解決方案。
Psaltis 和他的團(tuán)隊(duì)打算通過生物樣本測(cè)試這項(xiàng)技術(shù),看看是否和識(shí)別手寫數(shù)字一樣有效。他們希望利用不同類型的圖像進(jìn)行一系列研究,以探討這項(xiàng)技術(shù)的可能性和局限性。