最近的谷歌 I/O 開發(fā)者大會 (GoogleI/O Conference) 上高調宣布了人工智能 (AI) 為谷歌的業(yè)務重點之一。不僅是在搜索技術方面,在一些未來的項目,例如送貨無人機方面,人工智能也都是研發(fā)重點。
谷歌已經明確表示,現(xiàn)在,2016 年,人工智能正在進入消費者的家庭和手持設備,而我的同事在最近的帖子中也表達過類似的觀點。當然,谷歌并不是唯一一家想要在人工智能上大做文章的公司。微軟、Facebook、亞馬遜、百度和其他公司都在爭先恐后地創(chuàng)建用來實現(xiàn)人工智能的框架。
神經網絡 – 機器的大腦
神經網絡是模仿人類大腦的學習方法。隨著時間的推移,神經網絡已經發(fā)展成了聲音和圖像之類的感覺數據,可以從實際體驗中收集。大腦通過將這些感覺數據存儲到一個復雜的網絡中來進行學習,而這些數據日后可以用來高效地執(zhí)行許多不同的任務。
這些任務的示例包括識別對象、說話和理解說出的語言,以及解決復雜的問題,等等。大腦高效地執(zhí)行這些任務并且極少出錯的驚人能力吸引了機器學習專家嘗試通過人工手段來模仿它的能力。
在最近,我們已經很清楚,在這些領域人類相對于機器有著巨大的優(yōu)勢。現(xiàn)在,相關技術正以飛快的速度不斷發(fā)展,來逐漸彌補這種差距。例如,幾個月前,一個計算機程序在非常復雜的圍棋游戲中擊敗了世界上最頂尖的圍棋高手之一。
當時,專家認為要達到這種水平的人工智能至少還需要十年。而這種水平的人工智能就是通過谷歌旗下公司的深度神經網絡實現(xiàn)的?,F(xiàn)在,神經網絡正被廣泛應用,從自動駕駛到面部識別。業(yè)界的每個大公司都有一個很大的開發(fā)團隊在研究機器學習技術,并且每家公司都有自己的框架來支持軟件開發(fā)。
開源深度學習就是我們采取的措施
推動這些機器學習軟件模塊的最有效工具之一是開放它們的源代碼。Caffe,由伯克利視覺與學習中心 (Berkeley Vision and Learning Center) 開發(fā),是一個非常具有開創(chuàng)性的開源深度學習框架。蓬勃發(fā)展的開發(fā)人員社區(qū)通過使用和進一步增強 Caffe 顯然為所有想要加入的商業(yè)科技巨頭鋪平了道路。 在過去的一年左右,許多大公司的人工智能技術已經以開源代碼的形式發(fā)布了他們的模塊。去年九月,谷歌宣布將開放其 TensorFlow 軟件庫。今年年初,微軟在 GitHub 上共享了其計算網絡工具包 (CNTK),而 Facebook 人工智能研究中心 (FAIR) 則在 Torch 上共享了他們的深度學習模塊。這一系列的發(fā)布活動中最近的是亞馬遜的框架,即 Deep Scalable Sparse Tensor Network Engine (DSSTNE,發(fā)音類似于“命運”),它是今年 5 月份才在 GitHub 上開放的。
直到前不久,所有這些框架還都是高度保密的。現(xiàn)在,為了吸引開發(fā)人員并建立開發(fā)人員社區(qū)和生態(tài)系統(tǒng),每家公司都開放了他們的軟件,這樣就有很大的潛力來創(chuàng)造無限的人工智能應用。
將神經網絡引入嵌入式平臺隨著人工智能滲透到我們生活的多個方面,最大的挑戰(zhàn)之一就是把這種智能引入到小型的低功耗設備。這就需要引進嵌入式平臺,因為它可以用非常低的功耗提供極高的性能。但這還不夠。嵌入式平臺還必須支持上面的一個或多個框架,以充分發(fā)揮所有開源模塊的功能。 實現(xiàn)這一點的一種方法是使用專用硬件??梢栽O置一個能夠高效實現(xiàn)最新庫的硬件模塊,芯片可以單獨裝配和發(fā)貨。這種方法的問題在于,會使所有頂級公司已經理解并付諸行動的努力浪費掉。另外還會犧牲靈活性。
人工智能仍然是一個新興的技術領域。它會不斷發(fā)展和完善,它的全部潛力還遠遠沒有實現(xiàn)。每時每刻,都會有一群才華出眾的科學家和開發(fā)人員在推動人工智能的進步,并開發(fā)工具來發(fā)掘人工智能的潛能。這就是為什么只有使用可編程的靈活軟件解決方案才能真正發(fā)揮這些開源框架的能力。