3D打印、移動互聯(lián)、機器人、量子通信、大數(shù)據、干細胞、納米技術……日新月異的當代科技一方面沖擊著我們的大腦,另一方面已在影響乃至改變我們的生活。這些前沿科技領域在國內外的進展如何?中國科學家身處其中發(fā)揮了何種作用?公眾從正在醞釀的科技變革中汲取了怎樣的便利與實惠?未來又將如何發(fā)展?本報從今天開始,推出年終專稿“新科技改變生活”系列報道,系統(tǒng)梳理、展示這些技術領域的研用現(xiàn)狀以及它們對社會生活帶來的沖擊、改變及重構。
經常上網的你大概對這樣的場景并不陌生:當你習慣性地瀏覽網頁時,卻驚訝地發(fā)現(xiàn)廣告欄里竟然出現(xiàn)了前幾天在購物網站里搜索過的商品。“是誰干的?他怎么知道我想要買什么?”第一次遇見這樣的狀況,被看穿的感覺一定不好受。然而,這恰恰是大數(shù)據時代帶給我們的一個“驚喜”。
這些年,在信息技術領域紅極一時的“大數(shù)據”,正不知不覺地加緊滲透到我們的生活中。它前所未有地豐富了我們的生活并產生了極大的便捷,同時也對公眾的個人隱私構成威脅。
任何新技術的應用似乎都難以避免一種窘境:在機遇與風險之間尋找平衡。信息技術領域同樣如此。未來,大數(shù)據應用將在解決現(xiàn)實問題上產生更多亮點,也必將遇到信息安全方面更為嚴峻的挑戰(zhàn)。
全方位滲透生活
早在1980年,美國未來學家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數(shù)據贊頌為“第三次浪潮的華彩樂章”。不過,直到2009年,“大數(shù)據”才開始成為互聯(lián)網信息技術行業(yè)的流行詞匯。
今天,“大數(shù)據”已經在各行各業(yè)衍生出形形色色的數(shù)據應用。中國工程院院士李國杰曾表示:“推動大數(shù)據研究的動力主要來自企業(yè)的經濟效益”。IBM、谷歌、亞馬遜、Facebook等跨國巨頭正是發(fā)展大數(shù)據技術的主要推動者。
2008年推出的“谷歌流感趨勢”,至今看來仍不失為一個典型的大數(shù)據應用范例。谷歌設計人員認為,人們輸入的搜索關鍵詞代表了他們的即時需要。他們編入了“溫度計”、“肌肉疼痛”、“發(fā)燒”、“噴嚏”等與流感有關的關鍵詞,當用戶輸入這些關鍵詞時,系統(tǒng)便會開始跟蹤分析,創(chuàng)建流感圖表和地圖。
為了驗證“谷歌流感趨勢”預警系統(tǒng)的正確性,谷歌多次把測試結果與美國疾病控制與預防中心的報告作對比,結果證實兩者存在很大的相關性。
中科院軟件研究所副研究員張敏告訴《中國科學報》記者:“這正是大數(shù)據的應用方式之一,即發(fā)現(xiàn)統(tǒng)計規(guī)律。”她認為,大數(shù)據的應用方式還包括分析個體規(guī)律和集成形成知識。
在國內,購物網站對大數(shù)據應用顯得極為積極。中科院軟件所的幾名研究人員曾幫助淘寶網進行廣告排序的改進。他們抓取了淘寶網近900萬條廣告點擊數(shù)據,通過分析廣告類目、展現(xiàn)位置、商品價格、圖片內容等因素對用戶行為的影響,建立了用戶偏好模型。
“我們基于這些用戶偏好分析,幫助淘寶網建立了新的廣告排序算法,在線上測試中將廣告收益提高了5.5%。”該所副研究員楊達對《中國科學報》記者說。
電商平臺的偏好,僅僅是大數(shù)據應用的冰山一角。在醫(yī)療、商業(yè)、教育、金融、軍事、科研等領域,大數(shù)據技術也正在如火如荼地應用著。
連接虛擬與現(xiàn)實
今年7月,華東師范大學一名女生收到來自學校勤助中心的短信:“同學你好,發(fā)現(xiàn)你上個月餐飲消費較少,不知是否有經濟困難?如有困難,可電話、短信或郵件我。”
事實上,這名女生因為減肥減少了飯卡支出,觸發(fā)了學校對于飯卡消費數(shù)據的監(jiān)控系統(tǒng)。這個監(jiān)控系統(tǒng)通過對飯卡消費數(shù)據分析,了解學生的經濟狀況,推測如果花銷顯著少于正常情況,校方是否應采取必要的干預措施。
這名女生把短信截圖發(fā)到微博上,立即引來一片贊揚聲:“負責的學校,讓冰冷的數(shù)據有了人性之美。”
這一案例也成為業(yè)內人士一直津津樂道的一個觀點:大數(shù)據技術應用不能僅在數(shù)據上下功夫,還需要更多地與現(xiàn)實生活相結合。
大數(shù)據被寄予厚望的地方或許恰恰在于此——其創(chuàng)造價值的過程本身就是一場“商業(yè)和科學革命”。因而,數(shù)據處理與分析等基礎技術的突破已經不是當前的最大障礙,關鍵在于如何從商業(yè)、社會的角度充分理解數(shù)據。
“數(shù)據背后是網絡,網絡背后是人,研究網絡數(shù)據實際上是研究人組成的社會網絡。”在2012年5月召開的第424次香山科學會議上,李國杰提出建立一門大數(shù)據研究的“網絡數(shù)據科學”,重點研究數(shù)據背后的社會網絡。
就在他提出建立這門新型交叉學科之前的兩個月,美國聯(lián)邦政府宣布了“大數(shù)據研究和發(fā)展倡議”計劃,擬用2億美元提高從大量數(shù)字數(shù)據中訪問、組織、收集發(fā)現(xiàn)信息的工具和技術水平。
《大數(shù)據時代》一書的中文譯者周濤認為,大數(shù)據分析和利用與提升國家競爭力及國民幸福程度密切相關,數(shù)據儲備和數(shù)據分析能力將成為未來新型國家最重要的核心戰(zhàn)略能力。
周濤稱:“包括與國家安全、社會穩(wěn)定相關的尖端武器制造與性能模擬實驗,群體事件以及謠言的預警和干預;與國家科技能力相關的等離子即高能粒子實驗分析,納米材料及生物基因工程;與國民經濟繁榮相關的經濟金融態(tài)勢感知與失穩(wěn)預測,精準營銷與智能物流倉儲等。”
面向2020年,中國也將在戰(zhàn)略高度上將信息科技發(fā)展作為主戰(zhàn)場之一,在新科技革命進程中,加速人、機、物三元世界的融合發(fā)展。
挑戰(zhàn)信息安全
通過立法和各種有效手段保護個人隱私刻不容緩
回到文章開頭,被大數(shù)據應用猜到購物喜好的尷尬大概源于對個人隱私泄露的不安。的確,目前大數(shù)據應用面臨的挑戰(zhàn)之一便是對個人隱私信息的擔憂。
張敏回憶起前些年看過的一個科幻故事,描寫的是當時的作者暢想的現(xiàn)代生活:主人公早晨醒來打開一部類似手機的機器,機器自動彈出了主人公將要前往地點的路線及相關信息,不僅如此,主人公最喜歡的餐廳和電影也被自動推送出來。
“你能相信嗎,有一臺機器比你自己還了解你。”張敏感嘆。不過在她看來,這樣美好的未來對于個人隱私也是相當危險的。
“棱鏡計劃”是談論大數(shù)據時不得不提的事件。根據美國中情局前職員愛德華·斯諾登提供的信息,美國情報機構在2007年開始的“棱鏡”竊聽計劃中,對美國9家互聯(lián)網公司的數(shù)據進行挖掘工作,從音頻、視頻、圖片、郵件、文檔以及連接信息中分析個人的聯(lián)系方式與行動。該計劃一經曝光,便受到國際社會的譴責。
然而,《大數(shù)據時代》作者舍恩·伯格在評論斯諾登事件時曾表示,令他驚奇的并不是“棱鏡計劃”本身,而是大家對這個計劃如此驚奇,大多數(shù)人竟然仍以小數(shù)據的經驗和視野來看待它。
從大數(shù)據應用創(chuàng)新的角度來看,“棱鏡計劃”無疑是一個非常出色的案例,同樣暴露了大數(shù)據應用對個人隱私的威脅。
大數(shù)據時代如何保護個人隱私是一個共同關心的問題。在前不久召開的中國計算機學會青年計算機科技論壇上,南京大學計算機系教授仲盛介紹,傳統(tǒng)互聯(lián)網對個人信息保護的方式之一便是“去識別”,即去掉姓名等關鍵信息。那么,大數(shù)據時代,“去識別”還能保護隱私嗎?
例如,一家醫(yī)院在提供醫(yī)療服務時發(fā)現(xiàn)張家村有兩名45歲的男性患有某種疾病,其中一名未婚。在這條信息里,病人的個人信息雖然被去除了,但只要知道張家村有誰滿足45歲和未婚兩個條件,依然能知道究竟是誰患病。
仲盛指出,正是數(shù)據集成暴露了個人隱私。“即使每一個機構發(fā)布的數(shù)據都是安全的,但把它們結合在一起便什么都知道了。”他說。
從技術而言,科學家至今還沒有最有效的辦法為個人隱私“上保險”。大數(shù)據時代的信息安全恐怕需要新的社會規(guī)則來規(guī)范使用數(shù)據的行為。
2013年年初,世界經濟論壇發(fā)表《解除個人信息的價值:從收集到使用》的報告,甚至建議所有數(shù)據收集都應當使用密碼,以達到“限制使用數(shù)據”的目的。
大數(shù)據的應用對公眾信息安全來說無疑增加了一個新的維度。李國杰在接受媒體采訪時曾表示:“如何通過立法和各種手段真正保護個人的隱私,這是國家需要高度重視的一個新的安全問題。”