誰該擁有你的社交網(wǎng)絡(luò)數(shù)據(jù)?
CNW.com.cn
范范編譯
摘要: 分布式計算(Hadoop)和大數(shù)據(jù)(Big Data)技術(shù)的一個重要應(yīng)用是分析用戶的社交行為,有些時候它們會在用戶毫不知情的情況下進行分析。
Abstract:
Key words :
分布式計算(Hadoop)和大數(shù)據(jù)(Big Data)技術(shù)的一個重要應(yīng)用是分析用戶的社交行為,有些時候它們會在用戶毫不知情的情況下進行分析。
大數(shù)據(jù)通常指大量不斷增長的數(shù)據(jù),包括Facebook和Twitter網(wǎng)站上的非結(jié)構(gòu)化數(shù)據(jù),以及從這些數(shù)據(jù)中收集信息創(chuàng)造商業(yè)機會的方法。然而,這一概念對于那些在互聯(lián)網(wǎng)上展示自己生活的人來說具有風(fēng)險,同時也帶來了一個疑問,即到底誰該擁有這些數(shù)據(jù)?
大數(shù)據(jù)觸發(fā)大競技
大數(shù)據(jù)與Apache的Hadoop分布式計算平臺等技術(shù)相關(guān)聯(lián),同時促使包括IBM在內(nèi)的一些技術(shù)公司展開重量級收購。不過,GigaOm的分析師Derrick Harris指出,“大數(shù)據(jù)”的定義存在一些問題。他認(rèn)為,大數(shù)據(jù)實際上是指來自不同來源的數(shù)據(jù),包括社交網(wǎng)絡(luò)甚至手機等來源。他說:“這些數(shù)據(jù)正源源不斷地來自傳感器、計算機和Web。”
Harris指出,IT和業(yè)務(wù)部門對大數(shù)據(jù)的強烈興趣在于,能夠駕馭這些數(shù)據(jù),實際上就是能夠分析這些數(shù)據(jù)。Mozilla的開發(fā)人員Christian Heilmann稱,關(guān)于大數(shù)據(jù),好消息是我們積累了大量的信息,我們擁有可利用這些數(shù)據(jù)的系統(tǒng)。例如,分析人類基因組信息或者提供政府?dāng)?shù)據(jù)等。通過租用一個小時的服務(wù)器使用Hadoop等技術(shù),商業(yè)分析能夠研究這些大型的數(shù)據(jù)集。
由于廠商對此越來越重視,那么他們開始采取行動以利用大數(shù)據(jù)就不足為奇了。Harris指出,IBM最近用17億美元收購了提供數(shù)據(jù)倉庫設(shè)備的Netezza公司。同時,Teradata將收購提供非結(jié)構(gòu)化數(shù)據(jù)高級分析和管理的數(shù)據(jù)倉庫廠商Aster Data。
大數(shù)據(jù)所有權(quán)之爭
Heilmann把大數(shù)據(jù)看作是從網(wǎng)絡(luò)上收集的任何信息,任何實時的數(shù)據(jù)。但是,誰具體擁有這個數(shù)據(jù)呢?他說:“這個問題存在很大的爭議。”
“我認(rèn)為Facebook等網(wǎng)站讓用戶提供他們自己的信息,卻不讓用戶知道他們正在收集分析這些數(shù)據(jù)的行為是是很危險的。”Heilmann說。例如,用戶可以上載自己喝醉的照片,而他潛在的雇主至少在此后某一時間可以瀏覽這個照片。Heilmann強調(diào):“你從互聯(lián)網(wǎng)上刪除任何東西都是非常困難的。只要你把它放到網(wǎng)絡(luò)上,它就被存儲起來了。它將被復(fù)制到其他地方。你應(yīng)該對于你放在網(wǎng)絡(luò)上的東西非常慎重。”
Harris認(rèn)為,這個數(shù)據(jù)的所有權(quán)取決于環(huán)境。他說:“當(dāng)然是生成這個數(shù)據(jù)的公司擁有這個數(shù)據(jù)。”他指出,雖然在網(wǎng)絡(luò)上有公共所有的數(shù)據(jù),但是Facebook和Twitter擁有他們的用戶生成的數(shù)據(jù)。例如,數(shù)據(jù)市場等大型數(shù)據(jù)概念已經(jīng)導(dǎo)致一些公司一次用1個月時間分析Twitter的數(shù)據(jù)流。
Cloudera的CTO Awadallah認(rèn)為,誰擁有非結(jié)構(gòu)化數(shù)據(jù)這一問題是很難回答的。他舉例稱,例如蘋果應(yīng)用商店里的客戶采購信息就屬于蘋果公司,雖然谷歌向用戶提供刪除數(shù)據(jù)的權(quán)利,但是這些數(shù)據(jù)的所有權(quán)屬于谷歌。
相反,遷移社交網(wǎng)絡(luò)數(shù)據(jù)的數(shù)據(jù)攜帶計劃(Data Portability Project)則認(rèn)為,用戶擁有他們自己的數(shù)據(jù),社交網(wǎng)絡(luò)應(yīng)該讓用戶方便地把自己的數(shù)據(jù)帶到其他地方。該計劃的共同發(fā)起人、Echo公司負(fù)責(zé)戰(zhàn)略的副總裁Chris Saad表示,這一努力的目標(biāo)是,讓網(wǎng)站披露當(dāng)用戶把數(shù)據(jù)上載到網(wǎng)絡(luò)之后,用戶能夠?qū)ψ约旱臄?shù)據(jù)做些什么。
Saad同時指出,在一些案例中,用戶同他們使用的在線服務(wù)共享自己數(shù)據(jù)的所有權(quán)和監(jiān)護權(quán)。他說:“這就像把錢放在銀行一樣。雖然你擁有那些錢,但是你基本上是讓銀行為你保管,并可能代表你使用這些錢。”
這個問題不僅僅是隱私問題。“大數(shù)據(jù)”的定義之一就是,從多個來源中分析數(shù)據(jù),以便找出趨勢、商業(yè)機會、市場變化、潛在的客戶、客戶情感等許多事情。當(dāng)大數(shù)據(jù)工具分析網(wǎng)絡(luò)上的信息的時候,他們真的有權(quán)在未經(jīng)擁有者許可的情況下這樣做嗎?
對此,Saad說:“這實際上取決于具體情況。如果你在公共互聯(lián)網(wǎng)上發(fā)表這些信息,那么我認(rèn)為社會規(guī)則就是人們期待著自己的數(shù)據(jù)被提取、分析、索引和使用。另一方面,當(dāng)Facebook被視為一個私有網(wǎng)絡(luò),并且讓你選擇哪些信息可以公開時,這就有區(qū)別了,公開這些信息就違反了社會規(guī)則。”
此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。