《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 業(yè)界動態(tài) > 你對數(shù)據(jù)分析是不是有什么誤解?來看看這六個問題

你對數(shù)據(jù)分析是不是有什么誤解?來看看這六個問題

2018-03-22
關(guān)鍵詞: 數(shù)據(jù)分析

  作者:鮑勃·羅杰斯(Bob Rogers),英特爾首席數(shù)據(jù)科學(xué)家

  數(shù)據(jù)對于現(xiàn)代企業(yè)的重要程度不言而喻,擁有卓越的數(shù)據(jù)分析能力可在市場上擁有更大的競爭優(yōu)勢。然而企業(yè)用戶和一些決策者對于數(shù)據(jù)分析仍然有一些誤解和偏見。

  比如

  “我們企業(yè)并不需要機(jī)器學(xué)習(xí)這樣的高級分析工具?!?/p>

  “我們有很多數(shù)據(jù),但是分析沒啥用?!?/p>

  “我們要進(jìn)行數(shù)據(jù)分析就必須要聘請一批數(shù)據(jù)科學(xué)家!”

  接下來我們一一揭開這些對于數(shù)據(jù)分析迷之誤解背后的真相。

  1,“為了部署像機(jī)器學(xué)習(xí)(ML)這樣先進(jìn)的分析技術(shù),我們必須購入新硬件和大量投資專用基礎(chǔ)設(shè)施。”

  真相:部署高級的數(shù)據(jù)分析其實(shí)沒你想象中那么遙遠(yuǎn)。

  許多公司已經(jīng)擁有大量的高級分析基礎(chǔ)設(shè)施。例如,工廠車間通常有數(shù)千個傳感器,但通常不是所有的傳感器都被使用,因?yàn)樗鼈儺a(chǎn)生的數(shù)據(jù)是紛雜的,那么能夠很好的管理,存儲和集成所有的數(shù)據(jù)就是一個很好的起點(diǎn)。

  如果沒有可用于分析的大量現(xiàn)有硬件,也不用太擔(dān)心,許多云服務(wù)提供商 https://www.ferolabs.com/(CSP)就可以提供現(xiàn)成的高級分析功能。利用這些資源運(yùn)行一些試驗(yàn)項(xiàng)目,并由此制定有效的使用案例,然后可以制定一個長期投資路線圖,并清楚了解投入產(chǎn)出比。

  如果選擇內(nèi)部運(yùn)行,則可以使用現(xiàn)有的基于英特爾技術(shù)的平臺來經(jīng)濟(jì)高效地支持新項(xiàng)目。

  2,“我們不需要像機(jī)器學(xué)習(xí)這樣的高級分析工具?!?/p>

  真相:無論企業(yè)規(guī)模大小,每個企業(yè)都需要高級分析。

  很多企業(yè)都在做數(shù)據(jù)分析,也不乏很多企業(yè)還在用excel或者簡單的在線系統(tǒng)報(bào)告來做“數(shù)據(jù)分析”。

  真正的數(shù)據(jù)分析當(dāng)然沒有那么簡單,不過分析數(shù)據(jù)的第一步是要知道手中到底掌握什么數(shù)據(jù),在分析之前就要組織好。簡單的在線系統(tǒng)報(bào)告顯然已經(jīng)過時了,拜托,現(xiàn)在可是在數(shù)據(jù)爆炸的時代。

  要跟上競爭的步伐,了解數(shù)據(jù)的實(shí)時趨勢,使用當(dāng)前的數(shù)據(jù)來預(yù)測和影響 <https://www.intel.com/content/www/us/en/analytics/you-dont-need-analytics-myth-video.html>明天會發(fā)生的事情,這一點(diǎn)很重要。運(yùn)用先進(jìn)的機(jī)器學(xué)習(xí)和其他人工智能技術(shù),可以更快速地理解更多類型和更大量的數(shù)據(jù)。例如,人工智能技術(shù)可以幫助企業(yè)在業(yè)務(wù)流程中自動處理來自文本和圖像的信息,這有助于更高效的決策。隨著這些數(shù)據(jù)分析方式變得更加主流,那些不接受它們的人就肯定out啦。

  3,“我們有很多數(shù)據(jù),但分析不起作用?!?/p>

  真相:分析數(shù)據(jù)當(dāng)然是有用的,但是分析的必須是有效的數(shù)據(jù)。

  在一個高級數(shù)據(jù)分析的項(xiàng)目中,經(jīng)常會遇到這樣的抱怨“費(fèi)功夫分析了這么大量的數(shù)據(jù),最后得出的怎么還是錯誤的結(jié)果?

  這與數(shù)據(jù)的質(zhì)量有關(guān)。企業(yè)在分析數(shù)據(jù)之前需要有效的方式來收集數(shù)據(jù),并進(jìn)行去重和實(shí)時更新。AI(人工智能)和ML(機(jī)器學(xué)習(xí))算法只能處理給定的數(shù)據(jù),所以低質(zhì)量的數(shù)據(jù)意味著低質(zhì)量的結(jié)果。所以正確的使用數(shù)據(jù)管理策略,才會獲得真知灼見。

  4,“要做數(shù)據(jù)分析,我們需要聘請一批數(shù)據(jù)科學(xué)家!”

  真相:遠(yuǎn)在天邊,近在眼前。

  其實(shí)不是每個公司都需要一個常駐博士或者數(shù)據(jù)科學(xué)家。了解業(yè)務(wù)需求和掌握有效數(shù)據(jù)對決策者才是至關(guān)重要的。填補(bǔ)一個數(shù)據(jù)科學(xué)家的職位可能會非常棘手,特別是有特定產(chǎn)品或?qū)I(yè)知識要求極高的行業(yè),并不一定有非常匹配的數(shù)據(jù)科學(xué)家可以有效地發(fā)揮作用。所以說借助一些數(shù)據(jù)分析工具或者開展一些專業(yè)培訓(xùn),在企業(yè)內(nèi)部可能已經(jīng)培養(yǎng)出了所需的專家。

  另一種方法是讓運(yùn)營業(yè)務(wù)人員直接運(yùn)用數(shù)據(jù)分析工具。借助基于云的服務(wù)可以清理和處理企業(yè)的數(shù)據(jù),并提供出展示洞察的算法,這可以使得企業(yè)的業(yè)務(wù)專家轉(zhuǎn)變?yōu)閿?shù)據(jù)專家。

  5,“要去分析每一個數(shù)據(jù)”

  真相:分析每一個數(shù)據(jù)是不可能的,也是不必要的。衡量什么是戰(zhàn)略才是至關(guān)重要的。

  當(dāng)企業(yè)開始收集和整合數(shù)據(jù)時往往會遇到一個很大的誘惑--使用它的一切。但是這種方法可能會變得笨重和昂貴,而且大量不相關(guān)的信息會對結(jié)果產(chǎn)生不利影響。不斷自省正在分析哪個數(shù)據(jù)集是非常重要的。如果正在分析的這一部分?jǐn)?shù)據(jù)是沒有商業(yè)需求的,那大可以去分析更重要的數(shù)據(jù)。

  這里要強(qiáng)調(diào)的就是數(shù)據(jù)分析要基于業(yè)務(wù)需求。企業(yè)正在部署什么?企業(yè)一旦知道了這一點(diǎn)就可以設(shè)定可衡量的目標(biāo),基于這個目標(biāo)去開展數(shù)據(jù)分析工作。

  6,“高級數(shù)據(jù)分析意味著企業(yè)需要雇用額外的IT人員?!?/p>

  真相:現(xiàn)有團(tuán)隊(duì)其實(shí)足以迎接挑戰(zhàn)。

  對于一個企業(yè)來說,如果有自己的IT團(tuán)隊(duì),那么數(shù)據(jù)分析方面是有基礎(chǔ)的,也可能已經(jīng)取得一些進(jìn)展。數(shù)據(jù)分析最初的工作更多的是充分利用現(xiàn)有的數(shù)據(jù)。在有基礎(chǔ)且有數(shù)據(jù)分析能力的情況下,企業(yè)就有機(jī)會吸引才華橫溢的IT專家,他們會津津樂道地組織分析創(chuàng)新領(lǐng)先的機(jī)會。

  還有一種方法就是盤點(diǎn)公司內(nèi)部已有的數(shù)據(jù)分析能力,并與外部顧問(如行業(yè)分析師或供應(yīng)商)合作,獲取他們的建議并開展相關(guān)培訓(xùn)。如企業(yè)選擇內(nèi)部開發(fā)算法,可以通過FaaS模型(Function as a Service,功能即服務(wù),是一種無服務(wù)器計(jì)算,是IaaS演進(jìn)的下一個階段,它將底層基礎(chǔ)架構(gòu)從開發(fā)人員中分離出來,基本上虛擬化了運(yùn)行和運(yùn)營管理,無服務(wù)器架構(gòu)允許開發(fā)者執(zhí)行給定的任務(wù),而不必?fù)?dān)心服務(wù)器、虛擬機(jī)或底層計(jì)算資源,可極大地減少操作開銷和周期。)將其提供給組織內(nèi)的其他人,以最大限度地減少開發(fā)時間。

  所以無論企業(yè)規(guī)模大小,都應(yīng)該開展數(shù)據(jù)分析,數(shù)據(jù)分析也并不是遙不可及,企業(yè)要激發(fā)自有IT團(tuán)隊(duì)的能力,充分釋放數(shù)據(jù)潛力,讓企業(yè)增強(qiáng)市場競爭力。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。