早在100多年前,德國(guó)心理學(xué)家William Stern就推出了IQ測(cè)試,用來(lái)測(cè)量人們的智力。從此以后,IQ測(cè)試結(jié)果就成為現(xiàn)代生活中判定孩子學(xué)習(xí)能力以及成年人工作能力的一種標(biāo)準(zhǔn)。
IQ測(cè)試通常包括三類問(wèn)題,即邏輯問(wèn)題(如圖形推理)、數(shù)學(xué)問(wèn)題(如發(fā)現(xiàn)數(shù)列規(guī)律)以及文字推理類問(wèn)題,這些問(wèn)題都是基于類比、分類、同義詞或反義詞設(shè)置。
正是文字推理類問(wèn)題吸引了中國(guó)科技大學(xué)的王華正(Huazheng Wang)等以及北京微軟研究院的高斌等研究人員。電腦向來(lái)不擅長(zhǎng)文字推理類問(wèn)題,在一個(gè)自然語(yǔ)言處理機(jī)器里輸入文字推理類問(wèn)題,機(jī)器的表現(xiàn)會(huì)很糟糕,甚至與一般人的能力相比都相距甚遠(yuǎn)。
而現(xiàn)在,這一切都在發(fā)生著改變。研究人員研發(fā)的深度學(xué)習(xí)機(jī)器在處理文字類推理問(wèn)題方面的能力已經(jīng)首次超過(guò)了一般人。
將語(yǔ)言問(wèn)題變成數(shù)學(xué)問(wèn)題
最近幾年,電腦科學(xué)家通過(guò)使用數(shù)據(jù)挖掘技術(shù)分析巨大的文本語(yǔ)料庫(kù),以發(fā)現(xiàn)語(yǔ)料之間的聯(lián)系。這尤其給王華正等科學(xué)家統(tǒng)計(jì)單詞出現(xiàn)模式帶來(lái)了極大的便利,比如某個(gè)特定的詞在其他詞前后出現(xiàn)的頻率。這就使得在巨大的參數(shù)空間里,理清單詞之間的關(guān)系成為了可能。
這樣,在這個(gè)高緯度空間里就可以將單詞看做一個(gè)個(gè)向量,像其他向量一樣,可以使用比較、增值以及減值等數(shù)學(xué)方法進(jìn)行處理。這樣就會(huì)得到諸如下面的向量關(guān)系:國(guó)王—男人+女人=女王。
這個(gè)方法現(xiàn)在已經(jīng)取得重大成功。谷歌假設(shè)相近向量代表的不同語(yǔ)言詞序列在意思上是對(duì)等的,實(shí)現(xiàn)了語(yǔ)言自動(dòng)翻譯。
但是,這種方法有一個(gè)顯著的缺陷,即假設(shè)中,每個(gè)單詞的含義均由單一向量指代,因此單詞的含義也是單一的。而文字測(cè)試傾向于使用多義詞增加問(wèn)題的難度。
王華正等人通過(guò)查找單詞在語(yǔ)料庫(kù)中的常見(jiàn)搭配解決了這一問(wèn)題。接下來(lái)他們運(yùn)用運(yùn)算法則觀察這些單詞的分布。最后通過(guò)詞典查出單詞的不同含義,并將這些不同含義與不同分布的同一單詞對(duì)應(yīng)聯(lián)系起來(lái)。
因?yàn)樽值溽屃x里本身就包含單詞不同釋義的例句,因此這個(gè)步驟可以自動(dòng)完成。通過(guò)分析這些句子里的向量表示,并且將它們與每個(gè)分布點(diǎn)的向量表示進(jìn)行比較,就可能實(shí)現(xiàn)它們的對(duì)應(yīng)。
總體來(lái)說(shuō),這種方法就是鑒別單詞的不同含義。
除了上述方法,還有其他妙招用來(lái)提升電腦處理文字推理問(wèn)題的能力。妙招的關(guān)鍵點(diǎn)在于這些推理類問(wèn)題可以進(jìn)行分類,可用用略微不同的方法進(jìn)行處理。
因此,他們想到如果電腦可以辨別出問(wèn)題的類型,就可以選擇適當(dāng)?shù)奶幚聿呗?。因?yàn)橥活愋偷膯?wèn)題具有相似的結(jié)構(gòu),所以這個(gè)方法就顯得簡(jiǎn)單快捷。
類比問(wèn)題如下:
1.等溫線之于溫度相當(dāng)于等壓線之于()?
A.大氣 B. 風(fēng) C. 壓力 D. 高度
2.從括號(hào)中選出能與大寫(xiě)英文單詞搭配的一個(gè)英文單詞()?
A. CHAPTER (book, verse, read) B. ACT (stage, audience, play)
單詞分類問(wèn)題如下:
1.從以下選項(xiàng)中選出不同的一項(xiàng)()。
A.Calm B. Quiet C. Relaxed D. Serene E. Unruffled.
同義詞與反義詞問(wèn)題如下:
1.從以下選項(xiàng)中選出與英文單詞irrational意思最接近的一項(xiàng)()。
A. intransigent B. irredeemable C. unsafe D. lost E. nonsensical
2. 從以下選項(xiàng)中選出與musical意思相反的一項(xiàng)()。
A. discordant B. loud C. lyrical D. verbal E. euphonious
對(duì)掌握算法的機(jī)器來(lái)說(shuō),只要提供足夠的學(xué)習(xí)樣本,對(duì)問(wèn)題類型的識(shí)別就會(huì)相對(duì)簡(jiǎn)單。這也正是王華正等人正在研究的事。
識(shí)別出問(wèn)題類型之后,王華正等人采用標(biāo)準(zhǔn)向量法為每個(gè)類型問(wèn)題的處理設(shè)置了運(yùn)算法則。他們采用的標(biāo)準(zhǔn)向量法是自己研發(fā)的多義升級(jí)。
介于學(xué)士與碩士之間
他們將這種深度學(xué)習(xí)方法與其他能夠處理文字推理的算法以及人類處理文字推理的能力進(jìn)行了比較。然而,結(jié)果十分驚人。“出乎我們意料的是人類的平均表現(xiàn)竟比不過(guò)深度學(xué)習(xí)機(jī)器”。
人類在這些測(cè)試中的表現(xiàn)往往跟他們的教育背景有關(guān)。因此,擁本科學(xué)歷的人比擁有高中學(xué)歷的人表現(xiàn)要好,擁有博士學(xué)歷的表現(xiàn)最好。王華正等人稱他們的深度學(xué)習(xí)機(jī)器模型智力水平介于學(xué)士和碩士之間。
深度學(xué)習(xí)機(jī)器的出色表現(xiàn)足以說(shuō)明深度學(xué)習(xí)方法的發(fā)展?jié)摿?。王華正等人對(duì)于該方法未來(lái)的發(fā)展充滿自信,他們稱,只要正確運(yùn)用深度學(xué)習(xí)方法,在探究人類真正智力水平方面就會(huì)有進(jìn)一步發(fā)展。
如今,雖然深度學(xué)習(xí)方法已經(jīng)如同星星之火席卷了整個(gè)計(jì)算機(jī)科學(xué)領(lǐng)域,但是它所引起的革命仍然處于起步階段。誰(shuí)都不知道這場(chǎng)革命將會(huì)把我們帶到何處,但有一點(diǎn)可以確定的是:William Stern對(duì)這一切也不得不嘆服。