人工智能是一門交叉學(xué)科,從被提出到現(xiàn)在也有六十多年的歷史,目前仍處在AI初級(jí)階段。之所以發(fā)展緩慢的一個(gè)重要原因是人工智能的技術(shù)難度很高,它涉及計(jì)算機(jī)、心理學(xué)、哲學(xué)等,對(duì)從業(yè)者要求很高,目前國內(nèi)從事AI行業(yè)的工程師很多是碩士或以上學(xué)位。
人工智能技術(shù)可應(yīng)用于安防、醫(yī)療、家居、交通、智慧城市等各行各業(yè),其前景是毋庸置疑的,未來絕對(duì)是一個(gè)萬億級(jí)市場。根據(jù)應(yīng)用領(lǐng)域的不同,人工智能研究的技術(shù)也不盡相同,目前以機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺等成為熱門的AI技術(shù)方向,本文以機(jī)器學(xué)習(xí)為例,通過分析其關(guān)鍵技術(shù)與當(dāng)前面臨的難點(diǎn),一起探索人工智能的發(fā)展與未來。
機(jī)器學(xué)習(xí)是人工智能的核心
機(jī)器學(xué)習(xí)也被稱為人工智能的核心,它主要是研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為以獲取新的知識(shí)或技能,幫助計(jì)算機(jī)重新組織已有知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。
被稱作人工智能的核心,機(jī)器學(xué)習(xí)為什么這么難于研究?
機(jī)器學(xué)習(xí)是人工智能研究的一個(gè)分支,人們對(duì)機(jī)器學(xué)習(xí)的研究也有很多年了。它的發(fā)展過程大體上可分為幾個(gè)時(shí)期,第一是在20世紀(jì)50年代中葉到60年代中葉,屬于熱烈時(shí)期;第二是在20世紀(jì)60年代中葉至70年代中葉,被稱為機(jī)器學(xué)習(xí)的冷靜時(shí)期;第三是從20世紀(jì)70年代中葉至80年代中葉,稱為復(fù)興時(shí)期;第四階段的機(jī)器學(xué)習(xí)開始于1986年,目前我們?nèi)蕴幵谶@個(gè)時(shí)期。
現(xiàn)在很多應(yīng)用領(lǐng)域都可以看到機(jī)器學(xué)習(xí)的身影,如數(shù)據(jù)挖掘、自然語言處理、生物特征識(shí)別、搜索引擎、醫(yī)學(xué)診斷、證券、游戲、機(jī)器人等。
學(xué)習(xí)是一項(xiàng)非常復(fù)雜的過程,學(xué)習(xí)與推理分不開,按照學(xué)習(xí)中使用推理的多少,機(jī)器學(xué)習(xí)所采用的策略可分為四種:機(jī)械學(xué)習(xí)、傳授學(xué)習(xí)、類比學(xué)習(xí)和通過事例學(xué)習(xí)。學(xué)習(xí)中所用的推理越多,說明系統(tǒng)的能力越強(qiáng)。
機(jī)器學(xué)習(xí)的難度在哪?
對(duì)于機(jī)器學(xué)習(xí)的開發(fā)者而言,除了需要對(duì)數(shù)學(xué)知識(shí)掌握得非常熟練之外,選擇什么工具也很重要。一方面,機(jī)器學(xué)習(xí)的研究需要?jiǎng)?chuàng)新、實(shí)驗(yàn)和堅(jiān)持,很多人半途而廢;另一方面,如何將機(jī)器學(xué)習(xí)模型應(yīng)用到實(shí)際工作中也有難度。
除了工程師因素,機(jī)器學(xué)習(xí)的系統(tǒng)設(shè)計(jì)也有難度。影響學(xué)習(xí)系統(tǒng)設(shè)計(jì)的最重要的因素是環(huán)境向系統(tǒng)提供的信息,信息質(zhì)量直接影響系統(tǒng)性能,知識(shí)庫里存放的是指導(dǎo)執(zhí)行部分動(dòng)作的一般原則,但環(huán)境向?qū)W習(xí)系統(tǒng)提供的信息卻是各種各樣的。
如果信息質(zhì)量高,與一般原則的差別比較小,則機(jī)器學(xué)習(xí)比較容易處理。如果向?qū)W習(xí)系統(tǒng)提供的是無規(guī)律的指令信息,則學(xué)習(xí)系統(tǒng)需要在獲得足夠數(shù)據(jù)之后,刪除不必要的細(xì)節(jié),總結(jié)后才能形成指導(dǎo)動(dòng)作,并放入知識(shí)庫;這樣機(jī)器學(xué)習(xí)的任務(wù)就比較繁重,設(shè)計(jì)起來也較為困難。
被稱作人工智能的核心,機(jī)器學(xué)習(xí)為什么這么難于研究?
對(duì)于機(jī)器學(xué)習(xí)而言,還有一個(gè)技術(shù)難度就是機(jī)器學(xué)習(xí)的調(diào)試很復(fù)雜,如在進(jìn)行常規(guī)軟件設(shè)計(jì)時(shí),編寫的問題不能按預(yù)期工作,可能是算法和實(shí)現(xiàn)出現(xiàn)問題;但在機(jī)器學(xué)習(xí)里面,實(shí)際的模型和數(shù)據(jù)是兩個(gè)關(guān)鍵因素,這兩個(gè)的隨機(jī)性非常強(qiáng),調(diào)試難度倍增。除了復(fù)雜性,機(jī)器學(xué)習(xí)的調(diào)試周期一般都很長,因?yàn)闄C(jī)器得到指令進(jìn)行實(shí)施修正和改變通常需要十幾個(gè)小時(shí)甚至幾天。
谷歌是機(jī)器學(xué)習(xí)的推動(dòng)者
提到機(jī)器學(xué)習(xí),就不得不提到谷歌,2017年,它展示了聚焦人工智能的名為張量處理單元(TPU)的芯片,這是一款谷歌打造的處理器,是專為機(jī)器學(xué)習(xí)量身定做的。
TPU的特點(diǎn)是執(zhí)行每個(gè)操作所需的晶體管數(shù)量更少,自然效率更高,據(jù)谷歌介紹,TPU與同期的CPU和GPU相比,可以提供15-30倍的性能提升及30-80倍的效率提升。谷歌表示,它們專門為這款TPU設(shè)計(jì)了MXU作為矩陣處理器,可以在單個(gè)時(shí)鐘周期內(nèi)處理數(shù)十萬次運(yùn)算。谷歌提到,TPU的核心是脈動(dòng)陣列,MXU有著與傳統(tǒng)CPU、GPU截然不同的架構(gòu),稱為脈動(dòng)陣列;“脈動(dòng)”名字的來源是因?yàn)樵谶@種結(jié)構(gòu)中,數(shù)據(jù)一波一波地流過芯片,與心臟跳動(dòng)供血的方式類似。
機(jī)器學(xué)習(xí)技術(shù)助力人工智能
被稱作人工智能的核心,機(jī)器學(xué)習(xí)為什么這么難于研究?
機(jī)器學(xué)習(xí)被提出來也有一段時(shí)間了,但是發(fā)展并不是非??焖?,其中有自身的技術(shù)難度等原因。目前盡管機(jī)器學(xué)習(xí)面臨著很多技術(shù)問題去解決,但人工智能的發(fā)展和突破是繞不開它的,以谷歌為代表的企業(yè)為行業(yè)樹立了一個(gè)榜樣,筆者相信未來會(huì)有更多的企業(yè)加入到機(jī)器學(xué)習(xí)的研究之中,去推動(dòng)機(jī)器學(xué)習(xí),助力人工智能。