在大數(shù)據(jù)時代,海量數(shù)據(jù)不斷產(chǎn)生。企業(yè)數(shù)據(jù)量預(yù)計每 18 到 24 個月就會翻一番,且增速未見放緩。同時,企業(yè)數(shù)據(jù)的范圍越來越廣,從客戶信息、財務(wù)交易、邊緣計算到 IT 運營服務(wù)日志,各路數(shù)據(jù)匯聚成了“數(shù)據(jù)海洋”。
云計算架構(gòu)的快速發(fā)展帶來了更多數(shù)據(jù)處理方案。邊緣、內(nèi)部部署、公有云和私有云產(chǎn)品層出不窮,按需隨選和一切即服務(wù)(as a service)解決方案也在迅速擴張。毋庸置疑,我們處在一個多云世界,數(shù)據(jù)幾乎可以被存儲在任何地方。從中挖掘數(shù)據(jù)價值對于企業(yè)至關(guān)重要,卻也絕非易事。
在琳瑯滿目的云解決方案中,Cloudera 的與眾不同之處就在于幫助企業(yè)有效處理和管理存儲在任何地方的任何數(shù)據(jù)。Cloudera 所提出的企業(yè)數(shù)據(jù)云理念正是這個全面云化時代中的滄海明珠。
企業(yè)數(shù)據(jù)云 - 聚焦多云及混合云
在云計算發(fā)展早期,公有云似乎可以滿足 IT 部門的所有需求。公有云所提供的簡單模型,能夠節(jié)省企業(yè)數(shù)據(jù)中心擴張帶來的成本。然而其弊端也很快暴露出來,數(shù)據(jù)可能會被供應(yīng)商鎖定,導(dǎo)致企業(yè)無法隨需應(yīng)用,但轉(zhuǎn)移出來成本又很高。面對這些問題,IT 部門從實際經(jīng)驗中總結(jié)了一條真理——更多選擇,絕不設(shè)限。數(shù)據(jù)和工作負(fù)載應(yīng)該被放在最便于應(yīng)用且能夠創(chuàng)造價值的地方。企業(yè)的多樣化部署,造就了今天的混合和多云世界,也帶來了管理多個環(huán)境中數(shù)據(jù)的諸多挑戰(zhàn)。
Cloudera 的愿景是建立現(xiàn)代數(shù)據(jù)架構(gòu),幫助企業(yè)從數(shù)據(jù)中快速獲得價值。數(shù)據(jù)管理應(yīng)該從邊緣處的數(shù)據(jù)創(chuàng)建開始,直至最終的數(shù)據(jù)處理,無論是在公有云、私有云,還是本地數(shù)據(jù)中心。這種貫穿數(shù)據(jù)整個生命周期的管理方式,支持 Cloudera 平臺能夠打通企業(yè)內(nèi)部的數(shù)據(jù)孤島,讓相關(guān)業(yè)務(wù)部門能夠獲得其所需數(shù)據(jù)。畢竟,數(shù)據(jù)只有在對整個企業(yè)都實時可見、且被應(yīng)用時,才真正能夠釋放價值。
業(yè)界普遍認(rèn)為,非結(jié)構(gòu)化數(shù)據(jù)是企業(yè)數(shù)據(jù)的主要組成部分。在下一個十年里,非結(jié)構(gòu)化數(shù)據(jù)在所有數(shù)據(jù)中的占比預(yù)計將達(dá)到 80%。為了管理這些數(shù)據(jù),首先需要了解它們。企業(yè)需要對元數(shù)據(jù)進(jìn)行規(guī)范化和分類,并且從經(jīng)濟和運營角度考慮,將數(shù)據(jù)存放在最能產(chǎn)生價值的地方。任務(wù)雖然艱巨,但 Cloudera 在這一領(lǐng)域獨具優(yōu)勢。Cloudera 的產(chǎn)品在全球范圍內(nèi)管理著超過 40 萬臺服務(wù)器,從 5EB 數(shù)據(jù)中為企業(yè)不斷挖掘有價值的數(shù)據(jù)洞察。
企業(yè)數(shù)據(jù)云的落地 – Cloudera Data Platform (CDP)
Cloudera 在借助 AI 和機器學(xué)習(xí)管理數(shù)據(jù)領(lǐng)域已經(jīng)深耕多年。Cloudera 認(rèn)為,任何企業(yè)的數(shù)據(jù)戰(zhàn)略都必須跨越邊緣到云,數(shù)據(jù)管理必須自始至終。2019 年 1 月 Cloudera 宣布與 Hortonworks 合并。這兩家企業(yè)的強強聯(lián)手,使 Cloudera 一躍成為全球數(shù)據(jù)管理市場的佼佼者。Cloudera 的傳統(tǒng) AI 驅(qū)動數(shù)據(jù)管理與 Hortonworks 端到端數(shù)據(jù)管理方式相結(jié)合,創(chuàng)建了全球領(lǐng)先的下一代數(shù)據(jù)平臺 Cloudera Data Platform。Cloudera 希望為企業(yè)提供一個本身即是多云且多功能的平臺,用于管理企業(yè)數(shù)據(jù)云。通過統(tǒng)一的平臺界面,對數(shù)據(jù)進(jìn)行整個生命周期管理,并提供一致的安全和治理服務(wù)。
兩家企業(yè)的合并十分順利,短短 9 個月,Cloudera 就推出了公有云版本的 Cloudera Data Platform,其中包括 Cloudera Data Warehouse 和 Cloudera Machine Learning 服務(wù),目前已在 AWS 和 Microsoft Azure 上商用。除了將邊緣和云中數(shù)據(jù)管理整合在現(xiàn)有解決方案中,Cloudera 目前的重點在于為 CDP 提供私有云功能。上述功能的測試版將于今年夏天正式推出。
Cloudera 面對的是一個 260 億美元的巨大市場。未來三年內(nèi),市場規(guī)模預(yù)計將會翻倍至 520 億美元,這無疑是一個巨大的發(fā)展機遇。盡管市面上有很多企業(yè)數(shù)據(jù)管理產(chǎn)品,但是能夠縱觀全局、提供從邊緣到云的一致性體驗和全套功能的產(chǎn)品卻很少。Cloudera 將借此機會定義未來 15 至 20 年后的數(shù)據(jù)管理方式,并對新一代 IT 技術(shù)產(chǎn)生深遠(yuǎn)影響。