隨著大數據時代的來臨,大數據的巨大價值讓許多互聯(lián)網企業(yè)看到了新的商機,促使一批又一批的行業(yè)精英成為數據資產化之路的“墾荒人”。大數據的價值也由一個抽象的描述逐漸變成了可視化的計量。借助對數據資產的運營,諸多互聯(lián)網企業(yè)年年都可以拿出令人炫目的業(yè)績報表。而對于它們的財富來源,我們整個社會都是缺乏追問的。
當前,我國數據資源資產化正在如火如荼地開展,實踐的腳步早已超越理論走在“資產化”最前沿。目前,市場經濟已證實數據資產具有價值屬性,但其價值需要在數據的應用和流通中體現(xiàn)。實際上,無論政府還是部分企業(yè),都擁有非常豐富的大數據資源,但是大部分都被束之高閣,有數據需求的企業(yè)無法獲取。其中橫亙的第一道“天塹”就是數據產權的問題。這個問題看似簡單,實則不然。要探討清楚,還要從“數據”一詞說起。
1. 數據加工與數據資產化
?。?)數據加工:從原生數據到衍生數據
以數據加工為界,數據可以分為原始數據和二次開發(fā)利用數據。原始數據是指不依賴現(xiàn)有數據而產生的數據,即數據從0到1的過程。二次開發(fā)利用數據是指原始數據被存儲后,經過算法篩選聚合、加工、計算而成的系統(tǒng)的、可讀取、有使用價值的數據,如購物偏好數據、瀏覽偏好數據、分析數據等,即從1到f(1)的過程(注:從0到1僅表示從無到有的含義,f()僅表示數據的加工、計算、聚合的操作過程,均不表示具體含義)。
原始數據是不能再生的數據,而二次開發(fā)利用數據是可再生的數據。以互聯(lián)網為例,互聯(lián)網上的數據主要基于用戶行為而產生。用戶在互聯(lián)網上的操作包括兩類,一類是輸入,另一類是點擊。前者如用戶注冊時輸入姓名、郵箱,使用服務后的評論,使用搜索引擎時的搜索內容輸入,等等;后者如用戶通過鼠標點擊某個頁面、點擊某個商品鏈接、點擊下單、點擊提交、點擊確認,這些均屬于原始數據的范疇。而二次開發(fā)利用數據則是在這些用戶輸入和點擊的日志的基礎上,通過算法計算、加工、聚合后形成一條條結構化的數據。
當數據量小時,原生數據體現(xiàn)數據的價值,因為從數據內容中可以直接讀取直觀的信息獲取價值。當面對大數據時,原生數據的直觀價值銳減,反而側重于數據之間相關性的價值挖掘,這就是所謂的衍生數據價值。大數據時代,原生數據不能被直接利用,需要對其進行加工。就像翡翠原石的開采,在沒有加工成飾品時,翡翠原石與石頭一般無二。這樣的數據加工、計算、聚合,實現(xiàn)了從數據原石到數據寶石的演變。演變后,這種數據就是我們所稱的衍生數據。大數據經濟環(huán)境下,企業(yè)追逐的數據價值基本都體現(xiàn)在衍生數據上,而衍生數據價值的高低則取決于原生數據到衍生數據的聚合、加工、計算的準確程度。
?。?)數據資產化
數據加工讓數據的價值凸顯,而隨著大數據時代的到來,數據分析處理技術的提升使一個個數據抽象的描述逐漸成了可視化的計量,成為大數據進入國民經濟體系和國民視野的一個良好途徑。
那么,數據能否和其他財產一樣成為資產呢?我們還要先搞清楚資產的含義。在會計學領域,資產是指企業(yè)過去事項形成的屬于企業(yè)管領控制的、預期能為企業(yè)帶來經濟利益的總流入。同理,數據資產作為資產大類中的一員,其定義也應突出兩個方面:其一,企業(yè)合法占有數據資產,體現(xiàn)其控制屬性;其二,數據資產預計能為企業(yè)帶來經濟利益的正向流入,彰顯數據的價值屬性。通過以上兩個標準可知,數據并不等于數據資產。換句話說,并非所有的數據均有經濟利益,除非同時滿足可被計量、可被控制、可被變現(xiàn)的屬性。值得一提的是,數據資產的變現(xiàn)過程就是當前數據資產化的過程。
近年來,我國數據產業(yè)迅速發(fā)展,數據產業(yè)鏈中的一大亮點就是數據交易產業(yè)。2015年4月15日,貴陽大數據交易所正式掛牌。隨后,中關村數海數據資產評估中心有限公司也獲批成立,這是我國首家數據資產登記確權賦值的服務機構。目前,已有不少企業(yè)通過數據資產運營,讓數據實現(xiàn)了價值。廣東省數字廣東研究院、深圳市騰訊計算機系統(tǒng)有限公司作為賣方,完成了買方為中金數據系統(tǒng)有限公司、京東云平臺的首批數據交易。許多數據創(chuàng)新型企業(yè)通過數據資產登記評估等資產化獲得掛牌上市的機會,例如,優(yōu)勢科技、數云惠普成功在北京四板市場孵化板掛牌上市。還有很多企業(yè)成功將數據資產作為一種新型資產進行抵押,實現(xiàn)了融資,例如,貴州東方世紀科技有限公司成功抵押其數據資產,貸款100萬元。由此可見,當前數據資產化是大勢所趨,數據的經濟價值必然成為人們追逐的熱點。
2. 用數據說話:關于數據爭議案件的統(tǒng)計
近年來,因為不清楚數據歸誰而導致的問題數不勝數。下面,利用大數據的技術手段來介紹由此引發(fā)的紛爭。這里利用Alpha案例庫,檢索獲取了2019年3月30日前的民事糾紛裁判文書共計489678篇。其中,從2010年到2019年3月20日前的民事糾紛裁判文書分布如圖1所示。
圖片
圖1 民事糾紛裁判文書分布
從圖1可以看到,“數據”民事案件數量伴隨文書公開,基本呈逐年增長的趨勢。
從圖2的案由分類情況可以看到,當前的民事案件案由分布由多至少分別包括四類:合同、無因管理、不當得利糾紛類;侵權責任糾紛;勞動爭議、人事爭議類;知識產權與競爭糾紛類;人格權糾紛。
圖片
圖2 “數據”民事案件案由分布
繼續(xù)深入分析,目前有關數據權屬的爭議多以知識產權不正當競爭的案由顯現(xiàn)。下面進一步細分,將案由鎖定在知識產權與競爭糾紛類,看一下案件分布。本次檢索獲取了2019年3月30日前的知識產權與競爭糾紛裁判文書共30282篇。其中,從2010年到2019年3月20日前的知識產權糾紛裁判文書分布如圖3所示。
圖片
圖3 知識產權糾紛裁判文書分布
從圖3可以看到,“知識產權與競爭類糾紛”在2016-2017年呈現(xiàn)爆炸式增長。
從圖4的案由分類情況可以看到,當前最主要的案由是知識產權權屬、侵權糾紛類,其次是知識產權合同糾紛類,然后是不正當競爭糾紛類、壟斷糾紛類及其他知識產權與競爭糾紛。
圖片
圖4 “數據”知識產權與競爭糾紛案由分布
宏觀上,大數據很好地展示了數據糾紛以及數據權屬爭議正在社會生活中頻繁出現(xiàn),數據問題并非學者們的憑空臆想。從數據概念分析以及現(xiàn)階段圍繞數據利用產生的爭議來看,數據歸誰所有的問題是根源,必須要加以解決。
3. 數據產權的三大爭議:所有權、使用權、收益權
當前的數據產權爭議可以歸結為三大核心問題:數據歸誰所有?誰可以用數據?數據收益如何分配?
?。?)數據歸誰所有
典型案例是新浪微博起訴脈脈抓取和使用微博用戶信息案,該案也被業(yè)界稱為“大數據引發(fā)不正當競爭第一案”。
脈脈作為一款社交軟件,通過與新浪微博合作,能夠利用用戶的新浪微博發(fā)現(xiàn)新朋友,并幫助他們建立聯(lián)系。根據二者之間簽訂的《開發(fā)者協(xié)議》,脈脈只能獲得新浪微博用戶的姓名、性別、頭像、電子郵箱這些信息。然而,在合作期間,未經微博平臺許可,脈脈調用了大量微博用戶的教育信息、職業(yè)信息和手機號碼。此外,在合作終止后,脈脈仍將其用戶手機通信錄里的聯(lián)系人與新浪微博用戶對應,并展示在脈脈用戶“一度人脈”中。
新浪微博認為脈脈非法抓取了教育信息、職業(yè)信息以及手機號碼等高級權限下才能調取的信息,違反了與新浪微博簽訂的《開發(fā)者協(xié)議》,獲得了本屬于新浪微博的用戶信息。本案暴露的一個問題就是數據權屬問題,即新浪微博是否合法取得用戶在該平臺上的所有數據。
另一類數據爭議以騰訊微信與華為榮耀的數據之爭為代表。華為榮耀Magic手機從一發(fā)布便以“開啟智慧生活”“致未來”為口號,主打其高度的智能化。例如,用戶在與朋友閑聊談及某部電影時,手機會自動為用戶推送該電影的評分、網友評論及票務信息等;當用戶在晚上下班路過小區(qū)的快遞柜時,手機可以產生震動或發(fā)出鈴聲并推送用戶當天收到的快遞信息,以提醒用戶取件。
這是華為利用數據分析為我們展現(xiàn)的未來智能化生活。當人們在感慨華為榮耀Magic手機無比酷炫的同時,華為榮耀Magic手機卻不得不面對騰訊的質疑。騰訊認為華為榮耀Magic手機在使用過程中私自掃描用戶數據并自動加載相關信息的行為未經騰訊公司的許可,侵犯了微信用戶的隱私。
近年來,政府作為公共事務管理機關,無時無刻不在收集社會各界的數據信息,如我們的身份證信息、指紋信息、信用信息及出行信息等。目前,中央和省級政府正在推動建立統(tǒng)一的政務云平臺和數據共享交換平臺,致力于打破“數據孤島”,實現(xiàn)數據自由、有序流通。無論是政府各部門之間的數據交換共享,還是政府向社會公眾釋放數據信息以促進數字經濟的深度發(fā)展,都無法回避數據權屬問題。
公民的社保繳費記錄,患者的就診記錄,企業(yè)的工商登記信息……這些數據的產權屬于個人或企業(yè),還是屬于政府部門?如何做出清晰界定,將直接決定誰享有數據的權益。
大家普遍認為,政府部門收集數據是政府公共管理行為,也是非盈利性行為,所以政府部門收集的數據歸屬于政府無可厚非。但是,對于去除個人身份屬性的數據交易中的數據,到底歸屬于個人,還是記錄數據的企業(yè),各方莫衷一是。
(2)誰可以用數據
我們每個人無時無刻不在產生數據,也在頻繁地使用數據。例如,通過微信步數統(tǒng)計查看最近一周的運動量,通過應用監(jiān)測睡眠狀況、心跳情況,使用支付寶查詢最近的消費記錄,這些都是我們對自己數據的使用行為。個人產生和使用數據,并不意味著只有社會公眾可以使用數據,企業(yè)對這塊誘人的數據“蛋糕”只能望而卻步。如果真的如此,那就明顯與現(xiàn)階段的社會實情相背離,數字經濟也將面臨巨大的發(fā)展困境。
事實上,當前大規(guī)模使用數據的主體有兩個:一個是政府,另一個是企業(yè)。政府通過其各個行政機關、網站采集大量的政務數據。當前政府大數據使用旨在解決政務信息化建設中“各自為政、信息孤島”的問題,結合各地實際統(tǒng)籌推進政務信息系統(tǒng)整合共享的工作。各部門、各級政府信息系統(tǒng)要想實現(xiàn)互聯(lián)互通,首先面對的就是數據規(guī)模龐大,且來源、結構復雜的問題。
大數據在企業(yè)中的應用無處不在,包括金融、汽車、餐飲、電信、能源、體育和娛樂等在內的社會各行業(yè)都已經融入了大數據的印跡。具體地說,傳統(tǒng)行業(yè)如制造業(yè)利用工業(yè)大數據提升生產水平,包括產品故障診斷與預測、分析工藝流程、改進生產工藝,以及優(yōu)化生產過程能耗和生產排期;互聯(lián)網行業(yè)更是使用大數據的重點陣地,借助大數據技術,互聯(lián)網企業(yè)可以分析客戶行為,進行商品推薦和針對性廣告投放。在金融領域,大數據可以幫助企業(yè)分析高頻交易、客戶及信貸風險;當企業(yè)積累的數據達到一個量級時,可能產生質變,催生出新的商業(yè)模式。以螞蟻微貸為例,阿里巴巴利用多年的線上零售數據、支付金融數據、個人身份數據等,通過多維數據的整合、加工、計算構建信用維度,極大地提高了螞蟻微貸發(fā)放貸款的效率。這是人工智能和大數據在金融領域的初步應用,很多金融產品機構也在進行這方面的改進。
?。?)數據收益如何分配
通過使用數據產生巨額的經濟收益,那么,這份巨額收益是如何進行分配的呢?是分配給數據的產生者個人,還是賦予數據的收集、加工者政府或企業(yè)呢?對這個問題的回答牽動著眾多主體的利益。
從當前企業(yè)之間的爭議或司法判決來看,大數據產生的這部分收益歸屬于數據的收集、加工者,即企業(yè)。
新浪微博訴脈脈抓取用戶信息案確認了企業(yè)對其收集積累的數據享有競爭法意義上的財產權利。雖然目前我們并未針對數據的絕對財產權做出明確規(guī)定,但是法院在該案件中明確了以下原則:作為投入努力和資源進行數據收集的企業(yè),可以享有競爭法意義上的保護,即可以將該數據作為資產進行利用、許可,并從中獲益。在該案例中,法院明確了即便在技術可行的情況下(未使用破壞性的技術,或繞開權利人一方的技術保護措施),他人未經許可和授權也不得隨意進行信息抓取和利用。
大眾點評訴百度不正當競爭案中,司法裁判論證提出百度可以向大眾點評購買信息,這個論證思路暗含的規(guī)則就是承認大眾點評平臺對用戶點評數據的控制權,大眾點評平臺對其用戶數據享有收益、處分的權利,他人未經許可和授權不得隨意進行抓取和利用。這個觀點與新浪訴脈脈案不謀而合。
可見,當前無論是判決實踐還是司法態(tài)度,都偏向將數據收益分配給二次開發(fā)利用數據的收集者、創(chuàng)造者、實際控制者——企業(yè)。那么,作為政務數據的采集者政府以及數據的生產者個人在沒有司法判決的支持下,又是否能夠合法合理地享有數據收益權呢?這些問題都是數據治理的關鍵,需要在理論和立法上加以解決。