誰(shuí)該擁有你的社交網(wǎng)絡(luò)數(shù)據(jù)?
CNW.com.cn
范范編譯
摘要: 分布式計(jì)算(Hadoop)和大數(shù)據(jù)(Big Data)技術(shù)的一個(gè)重要應(yīng)用是分析用戶的社交行為,有些時(shí)候它們會(huì)在用戶毫不知情的情況下進(jìn)行分析。
Abstract:
Key words :
分布式計(jì)算(Hadoop)和大數(shù)據(jù)(Big Data)技術(shù)的一個(gè)重要應(yīng)用是分析用戶的社交行為,有些時(shí)候它們會(huì)在用戶毫不知情的情況下進(jìn)行分析。
大數(shù)據(jù)通常指大量不斷增長(zhǎng)的數(shù)據(jù),包括Facebook和Twitter網(wǎng)站上的非結(jié)構(gòu)化數(shù)據(jù),以及從這些數(shù)據(jù)中收集信息創(chuàng)造商業(yè)機(jī)會(huì)的方法。然而,這一概念對(duì)于那些在互聯(lián)網(wǎng)上展示自己生活的人來(lái)說(shuō)具有風(fēng)險(xiǎn),同時(shí)也帶來(lái)了一個(gè)疑問(wèn),即到底誰(shuí)該擁有這些數(shù)據(jù)?
大數(shù)據(jù)觸發(fā)大競(jìng)技
大數(shù)據(jù)與Apache的Hadoop分布式計(jì)算平臺(tái)等技術(shù)相關(guān)聯(lián),同時(shí)促使包括IBM在內(nèi)的一些技術(shù)公司展開重量級(jí)收購(gòu)。不過(guò),GigaOm的分析師Derrick Harris指出,“大數(shù)據(jù)”的定義存在一些問(wèn)題。他認(rèn)為,大數(shù)據(jù)實(shí)際上是指來(lái)自不同來(lái)源的數(shù)據(jù),包括社交網(wǎng)絡(luò)甚至手機(jī)等來(lái)源。他說(shuō):“這些數(shù)據(jù)正源源不斷地來(lái)自傳感器、計(jì)算機(jī)和Web。”
Harris指出,IT和業(yè)務(wù)部門對(duì)大數(shù)據(jù)的強(qiáng)烈興趣在于,能夠駕馭這些數(shù)據(jù),實(shí)際上就是能夠分析這些數(shù)據(jù)。Mozilla的開發(fā)人員Christian Heilmann稱,關(guān)于大數(shù)據(jù),好消息是我們積累了大量的信息,我們擁有可利用這些數(shù)據(jù)的系統(tǒng)。例如,分析人類基因組信息或者提供政府?dāng)?shù)據(jù)等。通過(guò)租用一個(gè)小時(shí)的服務(wù)器使用Hadoop等技術(shù),商業(yè)分析能夠研究這些大型的數(shù)據(jù)集。
由于廠商對(duì)此越來(lái)越重視,那么他們開始采取行動(dòng)以利用大數(shù)據(jù)就不足為奇了。Harris指出,IBM最近用17億美元收購(gòu)了提供數(shù)據(jù)倉(cāng)庫(kù)設(shè)備的Netezza公司。同時(shí),Teradata將收購(gòu)提供非結(jié)構(gòu)化數(shù)據(jù)高級(jí)分析和管理的數(shù)據(jù)倉(cāng)庫(kù)廠商Aster Data。
大數(shù)據(jù)所有權(quán)之爭(zhēng)
Heilmann把大數(shù)據(jù)看作是從網(wǎng)絡(luò)上收集的任何信息,任何實(shí)時(shí)的數(shù)據(jù)。但是,誰(shuí)具體擁有這個(gè)數(shù)據(jù)呢?他說(shuō):“這個(gè)問(wèn)題存在很大的爭(zhēng)議。”
“我認(rèn)為Facebook等網(wǎng)站讓用戶提供他們自己的信息,卻不讓用戶知道他們正在收集分析這些數(shù)據(jù)的行為是是很危險(xiǎn)的。”Heilmann說(shuō)。例如,用戶可以上載自己喝醉的照片,而他潛在的雇主至少在此后某一時(shí)間可以瀏覽這個(gè)照片。Heilmann強(qiáng)調(diào):“你從互聯(lián)網(wǎng)上刪除任何東西都是非常困難的。只要你把它放到網(wǎng)絡(luò)上,它就被存儲(chǔ)起來(lái)了。它將被復(fù)制到其他地方。你應(yīng)該對(duì)于你放在網(wǎng)絡(luò)上的東西非常慎重。”
Harris認(rèn)為,這個(gè)數(shù)據(jù)的所有權(quán)取決于環(huán)境。他說(shuō):“當(dāng)然是生成這個(gè)數(shù)據(jù)的公司擁有這個(gè)數(shù)據(jù)。”他指出,雖然在網(wǎng)絡(luò)上有公共所有的數(shù)據(jù),但是Facebook和Twitter擁有他們的用戶生成的數(shù)據(jù)。例如,數(shù)據(jù)市場(chǎng)等大型數(shù)據(jù)概念已經(jīng)導(dǎo)致一些公司一次用1個(gè)月時(shí)間分析Twitter的數(shù)據(jù)流。
Cloudera的CTO Awadallah認(rèn)為,誰(shuí)擁有非結(jié)構(gòu)化數(shù)據(jù)這一問(wèn)題是很難回答的。他舉例稱,例如蘋果應(yīng)用商店里的客戶采購(gòu)信息就屬于蘋果公司,雖然谷歌向用戶提供刪除數(shù)據(jù)的權(quán)利,但是這些數(shù)據(jù)的所有權(quán)屬于谷歌。
相反,遷移社交網(wǎng)絡(luò)數(shù)據(jù)的數(shù)據(jù)攜帶計(jì)劃(Data Portability Project)則認(rèn)為,用戶擁有他們自己的數(shù)據(jù),社交網(wǎng)絡(luò)應(yīng)該讓用戶方便地把自己的數(shù)據(jù)帶到其他地方。該計(jì)劃的共同發(fā)起人、Echo公司負(fù)責(zé)戰(zhàn)略的副總裁Chris Saad表示,這一努力的目標(biāo)是,讓網(wǎng)站披露當(dāng)用戶把數(shù)據(jù)上載到網(wǎng)絡(luò)之后,用戶能夠?qū)ψ约旱臄?shù)據(jù)做些什么。
Saad同時(shí)指出,在一些案例中,用戶同他們使用的在線服務(wù)共享自己數(shù)據(jù)的所有權(quán)和監(jiān)護(hù)權(quán)。他說(shuō):“這就像把錢放在銀行一樣。雖然你擁有那些錢,但是你基本上是讓銀行為你保管,并可能代表你使用這些錢。”
這個(gè)問(wèn)題不僅僅是隱私問(wèn)題。“大數(shù)據(jù)”的定義之一就是,從多個(gè)來(lái)源中分析數(shù)據(jù),以便找出趨勢(shì)、商業(yè)機(jī)會(huì)、市場(chǎng)變化、潛在的客戶、客戶情感等許多事情。當(dāng)大數(shù)據(jù)工具分析網(wǎng)絡(luò)上的信息的時(shí)候,他們真的有權(quán)在未經(jīng)擁有者許可的情況下這樣做嗎?
對(duì)此,Saad說(shuō):“這實(shí)際上取決于具體情況。如果你在公共互聯(lián)網(wǎng)上發(fā)表這些信息,那么我認(rèn)為社會(huì)規(guī)則就是人們期待著自己的數(shù)據(jù)被提取、分析、索引和使用。另一方面,當(dāng)Facebook被視為一個(gè)私有網(wǎng)絡(luò),并且讓你選擇哪些信息可以公開時(shí),這就有區(qū)別了,公開這些信息就違反了社會(huì)規(guī)則。”
此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。