《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 業(yè)界動態(tài) > 人工智能在智商測試中擊敗人類

人工智能在智商測試中擊敗人類

2015-06-16

  早在100多年前,德國心理學(xué)家William Stern就推出了IQ測試,用來測量人們的智力。從此以后,IQ測試結(jié)果就成為現(xiàn)代生活中判定孩子學(xué)習(xí)能力以及成年人工作能力的一種標準。

  IQ測試通常包括三類問題,即邏輯問題(如圖形推理)、數(shù)學(xué)問題(如發(fā)現(xiàn)數(shù)列規(guī)律)以及文字推理類問題,這些問題都是基于類比、分類、同義詞或反義詞設(shè)置。

  正是文字推理類問題吸引了中國科技大學(xué)的王華正(Huazheng Wang)等以及北京微軟研究院的高斌等研究人員。電腦向來不擅長文字推理類問題,在一個自然語言處理機器里輸入文字推理類問題,機器的表現(xiàn)會很糟糕,甚至與一般人的能力相比都相距甚遠。

  而現(xiàn)在,這一切都在發(fā)生著改變。研究人員研發(fā)的深度學(xué)習(xí)機器在處理文字類推理問題方面的能力已經(jīng)首次超過了一般人。

  將語言問題變成數(shù)學(xué)問題

  最近幾年,電腦科學(xué)家通過使用數(shù)據(jù)挖掘技術(shù)分析巨大的文本語料庫,以發(fā)現(xiàn)語料之間的聯(lián)系。這尤其給王華正等科學(xué)家統(tǒng)計單詞出現(xiàn)模式帶來了極大的便利,比如某個特定的詞在其他詞前后出現(xiàn)的頻率。這就使得在巨大的參數(shù)空間里,理清單詞之間的關(guān)系成為了可能。

  這樣,在這個高緯度空間里就可以將單詞看做一個個向量,像其他向量一樣,可以使用比較、增值以及減值等數(shù)學(xué)方法進行處理。這樣就會得到諸如下面的向量關(guān)系:國王—男人+女人=女王。

  這個方法現(xiàn)在已經(jīng)取得重大成功。谷歌假設(shè)相近向量代表的不同語言詞序列在意思上是對等的,實現(xiàn)了語言自動翻譯。

  但是,這種方法有一個顯著的缺陷,即假設(shè)中,每個單詞的含義均由單一向量指代,因此單詞的含義也是單一的。而文字測試傾向于使用多義詞增加問題的難度。

09ey-fxczyze9594246.png

  王華正等人通過查找單詞在語料庫中的常見搭配解決了這一問題。接下來他們運用運算法則觀察這些單詞的分布。最后通過詞典查出單詞的不同含義,并將這些不同含義與不同分布的同一單詞對應(yīng)聯(lián)系起來。

  因為字典釋義里本身就包含單詞不同釋義的例句,因此這個步驟可以自動完成。通過分析這些句子里的向量表示,并且將它們與每個分布點的向量表示進行比較,就可能實現(xiàn)它們的對應(yīng)。

  總體來說,這種方法就是鑒別單詞的不同含義。

  除了上述方法,還有其他妙招用來提升電腦處理文字推理問題的能力。妙招的關(guān)鍵點在于這些推理類問題可以進行分類,可用用略微不同的方法進行處理。

  因此,他們想到如果電腦可以辨別出問題的類型,就可以選擇適當?shù)奶幚聿呗?。因為同一類型的問題具有相似的結(jié)構(gòu),所以這個方法就顯得簡單快捷。

  類比問題如下:

  1.等溫線之于溫度相當于等壓線之于()?

  A.大氣 B. 風 C. 壓力 D. 高度

  2.從括號中選出能與大寫英文單詞搭配的一個英文單詞()?

  A. CHAPTER (book, verse, read) B. ACT (stage, audience, play)

  單詞分類問題如下:

  1.從以下選項中選出不同的一項()。

  A.Calm B. Quiet C. Relaxed D. Serene E. Unruffled.

  同義詞與反義詞問題如下:

  1.從以下選項中選出與英文單詞irrational意思最接近的一項()。

  A. intransigent B. irredeemable C. unsafe D. lost E. nonsensical

  2. 從以下選項中選出與musical意思相反的一項()。

  A. discordant B. loud C. lyrical D. verbal E. euphonious

  對掌握算法的機器來說,只要提供足夠的學(xué)習(xí)樣本,對問題類型的識別就會相對簡單。這也正是王華正等人正在研究的事。

  識別出問題類型之后,王華正等人采用標準向量法為每個類型問題的處理設(shè)置了運算法則。他們采用的標準向量法是自己研發(fā)的多義升級。

  介于學(xué)士與碩士之間

  他們將這種深度學(xué)習(xí)方法與其他能夠處理文字推理的算法以及人類處理文字推理的能力進行了比較。然而,結(jié)果十分驚人?!俺龊跷覀円饬系氖侨祟惖钠骄憩F(xiàn)竟比不過深度學(xué)習(xí)機器”。

  人類在這些測試中的表現(xiàn)往往跟他們的教育背景有關(guān)。因此,擁本科學(xué)歷的人比擁有高中學(xué)歷的人表現(xiàn)要好,擁有博士學(xué)歷的表現(xiàn)最好。王華正等人稱他們的深度學(xué)習(xí)機器模型智力水平介于學(xué)士和碩士之間。

  深度學(xué)習(xí)機器的出色表現(xiàn)足以說明深度學(xué)習(xí)方法的發(fā)展?jié)摿?。王華正等人對于該方法未來的發(fā)展充滿自信,他們稱,只要正確運用深度學(xué)習(xí)方法,在探究人類真正智力水平方面就會有進一步發(fā)展。

  如今,雖然深度學(xué)習(xí)方法已經(jīng)如同星星之火席卷了整個計算機科學(xué)領(lǐng)域,但是它所引起的革命仍然處于起步階段。誰都不知道這場革命將會把我們帶到何處,但有一點可以確定的是:William Stern對這一切也不得不嘆服。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。