誰該擁有你的社交網絡數據?
CNW.com.cn
范范編譯
摘要: 分布式計算(Hadoop)和大數據(Big Data)技術的一個重要應用是分析用戶的社交行為,有些時候它們會在用戶毫不知情的情況下進行分析。
Abstract:
Key words :
分布式計算(Hadoop)和大數據(Big Data)技術的一個重要應用是分析用戶的社交行為,有些時候它們會在用戶毫不知情的情況下進行分析。
大數據通常指大量不斷增長的數據,包括Facebook和Twitter網站上的非結構化數據,以及從這些數據中收集信息創(chuàng)造商業(yè)機會的方法。然而,這一概念對于那些在互聯網上展示自己生活的人來說具有風險,同時也帶來了一個疑問,即到底誰該擁有這些數據?
大數據觸發(fā)大競技
大數據與Apache的Hadoop分布式計算平臺等技術相關聯,同時促使包括IBM在內的一些技術公司展開重量級收購。不過,GigaOm的分析師Derrick Harris指出,“大數據”的定義存在一些問題。他認為,大數據實際上是指來自不同來源的數據,包括社交網絡甚至手機等來源。他說:“這些數據正源源不斷地來自傳感器、計算機和Web。”
Harris指出,IT和業(yè)務部門對大數據的強烈興趣在于,能夠駕馭這些數據,實際上就是能夠分析這些數據。Mozilla的開發(fā)人員Christian Heilmann稱,關于大數據,好消息是我們積累了大量的信息,我們擁有可利用這些數據的系統(tǒng)。例如,分析人類基因組信息或者提供政府數據等。通過租用一個小時的服務器使用Hadoop等技術,商業(yè)分析能夠研究這些大型的數據集。
由于廠商對此越來越重視,那么他們開始采取行動以利用大數據就不足為奇了。Harris指出,IBM最近用17億美元收購了提供數據倉庫設備的Netezza公司。同時,Teradata將收購提供非結構化數據高級分析和管理的數據倉庫廠商Aster Data。
大數據所有權之爭
Heilmann把大數據看作是從網絡上收集的任何信息,任何實時的數據。但是,誰具體擁有這個數據呢?他說:“這個問題存在很大的爭議。”
“我認為Facebook等網站讓用戶提供他們自己的信息,卻不讓用戶知道他們正在收集分析這些數據的行為是是很危險的。”Heilmann說。例如,用戶可以上載自己喝醉的照片,而他潛在的雇主至少在此后某一時間可以瀏覽這個照片。Heilmann強調:“你從互聯網上刪除任何東西都是非常困難的。只要你把它放到網絡上,它就被存儲起來了。它將被復制到其他地方。你應該對于你放在網絡上的東西非常慎重。”
Harris認為,這個數據的所有權取決于環(huán)境。他說:“當然是生成這個數據的公司擁有這個數據。”他指出,雖然在網絡上有公共所有的數據,但是Facebook和Twitter擁有他們的用戶生成的數據。例如,數據市場等大型數據概念已經導致一些公司一次用1個月時間分析Twitter的數據流。
Cloudera的CTO Awadallah認為,誰擁有非結構化數據這一問題是很難回答的。他舉例稱,例如蘋果應用商店里的客戶采購信息就屬于蘋果公司,雖然谷歌向用戶提供刪除數據的權利,但是這些數據的所有權屬于谷歌。
相反,遷移社交網絡數據的數據攜帶計劃(Data Portability Project)則認為,用戶擁有他們自己的數據,社交網絡應該讓用戶方便地把自己的數據帶到其他地方。該計劃的共同發(fā)起人、Echo公司負責戰(zhàn)略的副總裁Chris Saad表示,這一努力的目標是,讓網站披露當用戶把數據上載到網絡之后,用戶能夠對自己的數據做些什么。
Saad同時指出,在一些案例中,用戶同他們使用的在線服務共享自己數據的所有權和監(jiān)護權。他說:“這就像把錢放在銀行一樣。雖然你擁有那些錢,但是你基本上是讓銀行為你保管,并可能代表你使用這些錢。”
這個問題不僅僅是隱私問題。“大數據”的定義之一就是,從多個來源中分析數據,以便找出趨勢、商業(yè)機會、市場變化、潛在的客戶、客戶情感等許多事情。當大數據工具分析網絡上的信息的時候,他們真的有權在未經擁有者許可的情況下這樣做嗎?
對此,Saad說:“這實際上取決于具體情況。如果你在公共互聯網上發(fā)表這些信息,那么我認為社會規(guī)則就是人們期待著自己的數據被提取、分析、索引和使用。另一方面,當Facebook被視為一個私有網絡,并且讓你選擇哪些信息可以公開時,這就有區(qū)別了,公開這些信息就違反了社會規(guī)則。”
此內容為AET網站原創(chuàng),未經授權禁止轉載。