文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2017.02.002
中文引用格式: 李少波,陳永前. 大數(shù)據(jù)環(huán)境下制造業(yè)關(guān)鍵技術(shù)分析[J].電子技術(shù)應(yīng)用,2017,43(2):18-21,25.
英文引用格式: Li Shaobo,Chen Yongqian. Analysis on key technologies of manufacturing industry in big data environment[J].Application of Electronic Technique,2017,43(2):18-21,25.
0 引言
大數(shù)據(jù)(Big Data)這一概念的提出最早可以追溯到上世紀(jì)80年代[1],當(dāng)時(shí)并沒(méi)有得到人們的關(guān)注。直到2008年,著名雜志Nature出版了專(zhuān)刊《Big Data:Science in the Petabyte Era》[2],從經(jīng)濟(jì)學(xué)、互聯(lián)網(wǎng)技術(shù)、環(huán)境科學(xué)等多個(gè)領(lǐng)域介紹海量數(shù)據(jù)帶來(lái)的挑戰(zhàn)。從此大數(shù)據(jù)一詞被廣泛傳播,受到了各個(gè)國(guó)家、政府及各界的廣泛關(guān)注與研究,并在IT、金融、互聯(lián)網(wǎng)等行業(yè)得到了較大的發(fā)展與利用[3]。
制造業(yè)作為國(guó)家經(jīng)濟(jì)支柱性產(chǎn)業(yè),是我國(guó)綜合國(guó)力的表現(xiàn),充分地應(yīng)用和挖掘制造業(yè)中的數(shù)據(jù)逐漸成為行業(yè)研究和討論的熱點(diǎn)[4]。制造業(yè)具有地理分布廣泛,制造類(lèi)型多,制造過(guò)程復(fù)雜多樣,涉及領(lǐng)域廣等眾多特點(diǎn),是人類(lèi)社會(huì)中最復(fù)雜的行業(yè)之一,這決定了制造業(yè)將產(chǎn)生龐大的數(shù)據(jù)量,且有著類(lèi)型豐富、結(jié)構(gòu)多樣、增長(zhǎng)速度快等特點(diǎn),是一個(gè)典型的行業(yè)大數(shù)據(jù)體現(xiàn),以一個(gè)的典型的紡織制造企業(yè)來(lái)說(shuō),光是一個(gè)制造車(chē)間一天的數(shù)據(jù)量都將達(dá)到84 GB[5]。在制造業(yè)這種龐大的數(shù)據(jù)量與爆炸式的增長(zhǎng)新形勢(shì)下,傳統(tǒng)的制造業(yè)技術(shù)將不再夠用,不能滿(mǎn)足制造行業(yè)從海量數(shù)據(jù)中快速獲取知識(shí)與信息的需求。因此,在大數(shù)據(jù)環(huán)境下,制造技術(shù)將發(fā)生巨大的進(jìn)步與改革。
1 大數(shù)據(jù)下的制造業(yè)數(shù)據(jù)特點(diǎn)
1.1 大數(shù)據(jù)下的制造業(yè)數(shù)據(jù)來(lái)源
大數(shù)據(jù)不僅僅是一種數(shù)據(jù)處理技術(shù),而是一種總體視角的體現(xiàn),是一種綜合關(guān)聯(lián)性分析,發(fā)現(xiàn)具有潛在聯(lián)系之間的相關(guān)性,如將大數(shù)據(jù)單獨(dú)割裂來(lái)看,則大數(shù)據(jù)的大價(jià)值無(wú)從體現(xiàn)[6]。因此在進(jìn)行制造業(yè)大數(shù)據(jù)分析時(shí),必須全面地考慮制造業(yè)的數(shù)據(jù)來(lái)源。在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)等技術(shù)快速發(fā)展的今天,制造業(yè)的數(shù)據(jù)來(lái)源不僅包括了產(chǎn)品設(shè)計(jì)與開(kāi)發(fā)、產(chǎn)品加工與設(shè)備運(yùn)行、倉(cāng)庫(kù)管理等行業(yè)數(shù)據(jù),同時(shí)還包含了市場(chǎng)、客戶(hù)關(guān)系、政府計(jì)劃、互聯(lián)網(wǎng)等外部數(shù)據(jù)。制造業(yè)大數(shù)據(jù)來(lái)源如圖1所示。
1.2 大數(shù)據(jù)下的制造業(yè)數(shù)據(jù)特點(diǎn)
“大數(shù)據(jù)”一詞在業(yè)界都被普遍認(rèn)為有著“3V”特征[7],即Volume(容量大)、Variety(種類(lèi)多)、Velocity(速度快)。在制造業(yè)具有十分強(qiáng)的專(zhuān)業(yè)性、時(shí)序性、關(guān)聯(lián)性、流程性等特點(diǎn)情況下,不僅擁有大數(shù)據(jù)的“3V”特征,而且還有以下特征[8-9]:(1)強(qiáng)相關(guān)與高維度性。制造業(yè)各個(gè)數(shù)據(jù)間往往相互關(guān)聯(lián)相互耦合,從而構(gòu)成一個(gè)復(fù)雜多變量的高維系統(tǒng)。(2)強(qiáng)烈的非線(xiàn)性。在產(chǎn)品的生產(chǎn)過(guò)程中的許多物理和化學(xué)變化都表現(xiàn)為不可測(cè)的、非線(xiàn)性的。(3)高噪聲。互聯(lián)網(wǎng)大數(shù)據(jù)主要在乎數(shù)據(jù)的統(tǒng)計(jì)顯著性,對(duì)數(shù)據(jù)噪音并沒(méi)有太大的要求,而對(duì)于制造業(yè),只要出現(xiàn)一點(diǎn)差錯(cuò),都會(huì)造成巨大的損失,因此數(shù)據(jù)的高噪音是制造業(yè)大數(shù)據(jù)不可忽視的。
2 制造業(yè)的大數(shù)據(jù)技術(shù)架構(gòu)
制造業(yè)的大數(shù)據(jù)分析平臺(tái)是根據(jù)業(yè)務(wù)的需求逐步勾畫(huà)出來(lái)的[10]。針對(duì)制造業(yè)大數(shù)據(jù)的業(yè)務(wù)特點(diǎn),制造業(yè)大數(shù)據(jù)平臺(tái)在功能上應(yīng)滿(mǎn)足多種類(lèi)型數(shù)據(jù)的采集與導(dǎo)入,能存儲(chǔ)海量的、多樣的、多類(lèi)型的制造業(yè)大數(shù)據(jù),支持多種類(lèi)型的數(shù)據(jù)分析方法和數(shù)據(jù)展示方法。從性能方面考慮,制造業(yè)大數(shù)據(jù)平臺(tái)總架構(gòu)應(yīng)滿(mǎn)足可擴(kuò)展性、高錯(cuò)容性與可靠性、實(shí)時(shí)性、較好的安全性以及低成本等要求[11]。
在制造過(guò)程中,對(duì)大數(shù)據(jù)的實(shí)時(shí)分析與處理,對(duì)制造過(guò)程的實(shí)時(shí)決策及實(shí)時(shí)控制,是企業(yè)生產(chǎn)安全有序進(jìn)行、及時(shí)決策、提高效率、減少損失的重要保障[12]。另一方面,制造業(yè)是一個(gè)高維非線(xiàn)性的復(fù)雜性行業(yè),一個(gè)普通的制造企業(yè),其內(nèi)部就包含著許多子系統(tǒng),例如制造執(zhí)行系統(tǒng)(MES)、企業(yè)資源計(jì)劃(ERP)、產(chǎn)品數(shù)據(jù)管理(PDM)等。每一個(gè)子系統(tǒng)往往又包含著許多業(yè)務(wù)流程,產(chǎn)生著大量的數(shù)據(jù),甚至可以單獨(dú)構(gòu)成一個(gè)領(lǐng)域的大數(shù)據(jù),例如供應(yīng)鏈管理大數(shù)據(jù)就是大數(shù)據(jù)在供應(yīng)鏈的一個(gè)應(yīng)用[13]。
綜上,根據(jù)制造業(yè)實(shí)際需求和業(yè)務(wù)狀況相結(jié)合,勾畫(huà)出制造業(yè)大數(shù)據(jù)技術(shù)架構(gòu)如圖2所示。在該架構(gòu)中,系統(tǒng)先將各種來(lái)源的數(shù)據(jù)進(jìn)行集成處理,再根據(jù)對(duì)各部分?jǐn)?shù)據(jù)的要求與特點(diǎn)選擇不同的處理方式,并根據(jù)業(yè)務(wù)的需求進(jìn)行分析,最后用不同的數(shù)據(jù)展現(xiàn)方式將信息傳達(dá)給各個(gè)應(yīng)用系統(tǒng)。
3 大數(shù)據(jù)下的制造業(yè)關(guān)鍵技術(shù)
3.1 大數(shù)據(jù)集成技術(shù)
數(shù)據(jù)集成技術(shù)就是把不同來(lái)源、格式、特點(diǎn)、性質(zhì)的數(shù)據(jù)在邏輯上或者物理上有機(jī)地集中,為系統(tǒng)存儲(chǔ)一系列面向主題的、相對(duì)穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,從而為系統(tǒng)提供全面的數(shù)據(jù)共享[14]。大數(shù)據(jù)的集成技術(shù)是解決制造企業(yè)各系統(tǒng)間的數(shù)據(jù)沉余和“信息孤島”的重要工具。按照數(shù)據(jù)集成點(diǎn)不同,可以將其分為源端和應(yīng)用端數(shù)據(jù)集成。
(1)源端數(shù)據(jù)集成。在制造企業(yè)中,數(shù)據(jù)來(lái)源十分廣泛,數(shù)據(jù)格式復(fù)雜,不僅有傳統(tǒng)的內(nèi)部生產(chǎn)數(shù)據(jù),還有市場(chǎng)數(shù)據(jù)、客戶(hù)關(guān)系數(shù)據(jù)、價(jià)值鏈數(shù)據(jù)等。面對(duì)重多的數(shù)據(jù)來(lái)源和格式,如果直接將其進(jìn)行大數(shù)據(jù)分析,不但會(huì)導(dǎo)致分析速度的下降,而且還會(huì)影響數(shù)據(jù)分析的質(zhì)量[15],因此在數(shù)據(jù)分析前將數(shù)據(jù)集成為統(tǒng)一格式是制造業(yè)大數(shù)據(jù)分析的重要步驟。源端數(shù)據(jù)集成如圖3所示。
(2)應(yīng)用端的數(shù)據(jù)集成。制造業(yè)內(nèi)部存在許多應(yīng)用系統(tǒng),例如生產(chǎn)應(yīng)用、供應(yīng)鏈應(yīng)用、定制應(yīng)用等,不同的應(yīng)用系統(tǒng)間往往有不同的數(shù)據(jù)庫(kù)和數(shù)據(jù)形式,且各個(gè)應(yīng)用系統(tǒng)之間的數(shù)據(jù)一般只能供自己使用,而這樣就很容易產(chǎn)生信息孤島。對(duì)應(yīng)用端數(shù)據(jù)進(jìn)行集成將會(huì)利于各個(gè)部門(mén)與系統(tǒng)間的信息共享,避免企業(yè)信息孤島的產(chǎn)生。應(yīng)用端數(shù)據(jù)集成如圖4所示。
3.2 大數(shù)據(jù)存儲(chǔ)技術(shù)
大數(shù)據(jù)下的制造業(yè)對(duì)數(shù)據(jù)存儲(chǔ)將面臨著以下挑戰(zhàn):(1)存儲(chǔ)數(shù)據(jù)量大,制造業(yè)大數(shù)據(jù)量將達(dá)到PB級(jí)別甚至更高;(2)制造業(yè)大數(shù)據(jù)來(lái)源廣,數(shù)據(jù)形式和數(shù)據(jù)結(jié)構(gòu)都比較復(fù)雜;(3)滿(mǎn)足數(shù)據(jù)的完整性;(4)數(shù)據(jù)讀取和寫(xiě)入速度應(yīng)達(dá)到業(yè)務(wù)的需求;(5)具備可擴(kuò)展性。顯然,傳統(tǒng)的數(shù)據(jù)庫(kù)明顯有點(diǎn)力不從心,制造業(yè)大數(shù)據(jù)的存儲(chǔ)還要尋求新的方法。分布式文件系統(tǒng)是大數(shù)據(jù)時(shí)代數(shù)據(jù)存儲(chǔ)最好的工具,比較有代表性的分布式文件系統(tǒng)當(dāng)屬Hadoop的HDFS[16]。HDFS是受到Google文件系統(tǒng)(GFS)的啟發(fā)而構(gòu)建的,有著支持超大文件、低延遲數(shù)據(jù)訪(fǎng)問(wèn)、高錯(cuò)容性、可擴(kuò)展、可運(yùn)行在普通機(jī)器上等優(yōu)點(diǎn)[17],HDFS的工作原理如圖5所示[10][18]。
3.3 大數(shù)據(jù)處理技術(shù)
制造業(yè)的大數(shù)據(jù)處理技術(shù)主要包含了批處理、流處理和內(nèi)存計(jì)算[19],分別滿(mǎn)足制造業(yè)大數(shù)據(jù)處理的不同需求。
3.3.1 批處理技術(shù)
目前最主流的批處理技術(shù)當(dāng)屬Google公司在2004年提出的MapReduce分布式計(jì)算模式,基于該框架寫(xiě)出來(lái)的應(yīng)用程序可以在普通機(jī)器群集上運(yùn)行,能夠輕松地處理TB級(jí)別以上的數(shù)據(jù)集,且有良好的錯(cuò)容性。
在MapReduce中,一個(gè)計(jì)算流程分為map和reduce兩個(gè)階段。在map階段,其輸入文件(Input file)往往會(huì)被劃分為固定大小的輸入塊(split)。每個(gè)塊都會(huì)對(duì)應(yīng)著一個(gè)map任務(wù),該map任務(wù)中的map函數(shù)會(huì)作用于split中的每一個(gè)記錄(record),一個(gè)記錄就是一個(gè)<key,value>鍵值對(duì)。map任務(wù)完成后,其結(jié)果(<key,value>鍵值對(duì))會(huì)被進(jìn)行分區(qū)(partition),然后暫時(shí)寫(xiě)入到磁盤(pán)中,為reduce階段做準(zhǔn)備。在reduce階段,map階段的每個(gè)partition都會(huì)被分配至某個(gè)reduce任務(wù),等到reduce階段處理完成后,其結(jié)果將會(huì)被存入到分布式文件系統(tǒng)(HDFS)中。MapReduce整個(gè)處理流程如圖6所示[12]。
3.3.2 流處理技術(shù)
批處理技術(shù)對(duì)大批量靜態(tài)的數(shù)據(jù)處理是有效的,然而在制造企業(yè)中,不光要處理大批量的靜態(tài)數(shù)據(jù),而且還要處理像生產(chǎn)監(jiān)控?cái)?shù)據(jù)、故障警報(bào)數(shù)據(jù)等動(dòng)態(tài)和大批量小數(shù)據(jù)。
流處理(Stream Computing)技術(shù)對(duì)這種數(shù)據(jù)的處理往往是非常有效的[20]。當(dāng)有數(shù)據(jù)到來(lái)時(shí),流處理工具就應(yīng)該立刻響應(yīng),然后把處理后得到的信息馬上呈送給用戶(hù)或系統(tǒng),這種數(shù)據(jù)處理無(wú)須數(shù)據(jù)準(zhǔn)備時(shí)間,從而有很好的實(shí)時(shí)性。目前,流處理計(jì)算框架主要有:Apache S4、Storm、Scribe、Kafka等,下面用比較主流的S4進(jìn)行介紹。
S4(Simple Scalable Streaming System)[21-22]是一個(gè)分布式流計(jì)算模型,S4有著良好的通用性、可擴(kuò)展性、錯(cuò)容性等優(yōu)點(diǎn)。S4在對(duì)數(shù)據(jù)處理時(shí),將數(shù)據(jù)流看成是事件(Event)的序列流。每個(gè)Event是一個(gè)(K,A)元素,通過(guò)EventType來(lái)標(biāo)示其類(lèi)型。K、A分別表示這種類(lèi)型的 Event的若干個(gè)關(guān)鍵字和若干個(gè)屬性。在這種抽象的基礎(chǔ)上,設(shè)計(jì)者將Processing Elements(PE)定義為S4中的最小數(shù)據(jù)計(jì)算單元。每個(gè)PE只負(fù)責(zé)處理Event type、屬性Key和屬性Value都匹配的事件,并最終輸出結(jié)果或新的(K,A)元素。每個(gè)S4都包含有若干個(gè)這樣的PE,當(dāng)數(shù)據(jù)到來(lái)時(shí),便立刻共同作業(yè),完成數(shù)據(jù)流的處理。
3.3.3 內(nèi)存計(jì)算
內(nèi)存計(jì)算技術(shù),就是指CPU直接從內(nèi)存上讀取數(shù)據(jù),并進(jìn)行計(jì)算、分析。內(nèi)存計(jì)算大大減少了從硬盤(pán)讀取數(shù)據(jù)的時(shí)間,是對(duì)傳統(tǒng)數(shù)據(jù)處理模式的一種速度提升。比較有代表性的內(nèi)存計(jì)算系統(tǒng)有SAP HANA、Oracle Exadata和IBM pureData。
較批處理與流處理來(lái)說(shuō),內(nèi)存計(jì)算的最大優(yōu)勢(shì)就在于其處理數(shù)據(jù)的速度,從而決定了內(nèi)存計(jì)算非常適合需要實(shí)時(shí)獲得結(jié)果的數(shù)據(jù),是制造業(yè)大數(shù)據(jù)分析和數(shù)據(jù)處理中的關(guān)鍵應(yīng)用技術(shù)之一。 內(nèi)存計(jì)算的原理非常簡(jiǎn)單,如圖7所示[20]。
3.4 大數(shù)據(jù)分析技術(shù)
大數(shù)據(jù)技術(shù)的根本驅(qū)動(dòng)力是將信號(hào)轉(zhuǎn)化為數(shù)據(jù),將數(shù)據(jù)分析為消息,將消息提煉為知識(shí),以知識(shí)促成決策和應(yīng)用[24]。經(jīng)過(guò)數(shù)據(jù)的集成與處理后,所得的數(shù)據(jù)便成為數(shù)據(jù)分析的原始數(shù)據(jù),根據(jù)業(yè)務(wù)的需求與應(yīng)用,再對(duì)數(shù)據(jù)進(jìn)一步的分析,最后得到所需要的知識(shí)。
傳統(tǒng)意義上的數(shù)據(jù)分析技術(shù)是先將數(shù)據(jù)進(jìn)行存儲(chǔ),然后對(duì)數(shù)據(jù)進(jìn)行篩選,建立數(shù)據(jù)中心,在此基礎(chǔ)上建立數(shù)據(jù)倉(cāng)庫(kù),再根據(jù)業(yè)務(wù)需求來(lái)進(jìn)行聯(lián)機(jī)分析處理(OLAP)[11]。這種方法對(duì)于結(jié)構(gòu)復(fù)雜、實(shí)時(shí)性要求高,分析程度較深的制造業(yè)大數(shù)據(jù)來(lái)說(shuō)是無(wú)能為力的。根據(jù)制造業(yè)大數(shù)據(jù)的數(shù)據(jù)特點(diǎn)與業(yè)務(wù)要求,制造業(yè)大數(shù)據(jù)的數(shù)據(jù)分析主要面臨的困難是大量非結(jié)構(gòu)化復(fù)雜數(shù)據(jù)分析和實(shí)時(shí)預(yù)測(cè)分析。因此可以利用以下思想去解決制造業(yè)大數(shù)據(jù)的分析難題:(1)對(duì)數(shù)據(jù)進(jìn)行處理。在面臨結(jié)構(gòu)復(fù)雜的大數(shù)據(jù)時(shí),利用?;枷耄瑢⒋髷?shù)據(jù)進(jìn)行粒分,變大數(shù)據(jù)為小數(shù)據(jù)后再進(jìn)行分析;(2)加強(qiáng)對(duì)新一代數(shù)據(jù)分析工具的利用與研究。例如EMC的GreenPlum數(shù)據(jù)分析工作臺(tái)、Teradata的Aster Data平臺(tái)等;(3)通過(guò)人工智能和機(jī)器學(xué)習(xí)等技術(shù)分析大數(shù)據(jù)[24]。
3.5 大數(shù)據(jù)展現(xiàn)技術(shù)
制造業(yè)的大數(shù)據(jù)展現(xiàn)技術(shù)可以分為制造過(guò)程數(shù)據(jù)展現(xiàn)技術(shù)、歷史數(shù)據(jù)展現(xiàn)技術(shù)及可視化技術(shù)。
制造過(guò)程數(shù)據(jù)展現(xiàn)技術(shù)是制造業(yè)大數(shù)據(jù)展現(xiàn)技術(shù)的關(guān)鍵部分。隨著制造物聯(lián)的快速發(fā)展,制造企業(yè)會(huì)產(chǎn)生大量生產(chǎn)現(xiàn)場(chǎng)實(shí)時(shí)數(shù)據(jù),如果將這些實(shí)時(shí)數(shù)據(jù)實(shí)時(shí)展現(xiàn)出來(lái),那么就可以清晰地了解到生產(chǎn)現(xiàn)場(chǎng)的實(shí)時(shí)變化情況,這樣不僅提高了企業(yè)的生產(chǎn)效率,而且能完善企業(yè)的資源配置,是實(shí)現(xiàn)智慧生產(chǎn)的重要步驟。
歷史數(shù)據(jù)展現(xiàn)技術(shù)主要體現(xiàn)在制造業(yè)對(duì)歷史數(shù)據(jù)的管理和展示上,這里的歷史數(shù)據(jù)一般指對(duì)實(shí)時(shí)性要求不是太強(qiáng)的數(shù)據(jù),例如企業(yè)生產(chǎn)歷史數(shù)據(jù)、客戶(hù)關(guān)系數(shù)據(jù)、競(jìng)爭(zhēng)對(duì)手?jǐn)?shù)據(jù)等。企業(yè)對(duì)歷史數(shù)據(jù)分析展現(xiàn),可以繪制出數(shù)據(jù)的發(fā)展趨勢(shì)并預(yù)測(cè)出未來(lái)的數(shù)據(jù)走勢(shì),可以模擬歷史重大事件發(fā)生與演變,挖掘歷史事件潛在的知識(shí)與規(guī)律。
數(shù)據(jù)可視化技術(shù)是指運(yùn)用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像在屏幕上顯示出來(lái),并進(jìn)行交互處理的方法和技術(shù)[25]。制造業(yè)的復(fù)雜性、多系統(tǒng)性決定了數(shù)據(jù)的分析結(jié)果會(huì)呈現(xiàn)出多維的特點(diǎn)。數(shù)據(jù)可視化技術(shù)正是解決這一系列問(wèn)題的,它以一種簡(jiǎn)單易懂的方式將復(fù)雜的數(shù)據(jù)呈現(xiàn)給我們,不僅讓我們更容易去理解數(shù)據(jù),而且對(duì)發(fā)現(xiàn)數(shù)據(jù)中新的信息也起到非常關(guān)鍵的作用。目前常見(jiàn)的可視化技術(shù)有Tag cloud、History flow、Spatial information flow等。
4 結(jié)語(yǔ)
“中國(guó)制造2025”和德國(guó)“工業(yè)4.0”紛紛指出智能制造是制造業(yè)未來(lái)的發(fā)展趨勢(shì),而大數(shù)據(jù)技術(shù)則是助力實(shí)現(xiàn)智能制造不可缺失的一把利劍。將來(lái),制造技術(shù)不光是指?jìng)鹘y(tǒng)的機(jī)械加工等技術(shù),而是一種集制造業(yè)與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)、大數(shù)據(jù)、云計(jì)算等信息技術(shù)為一體的新局面,這是制造業(yè)智能化、綠色化的必要前提。大數(shù)據(jù)技術(shù)已廣泛使用在互聯(lián)網(wǎng)、電商、金融等行業(yè),并創(chuàng)造了較大的商業(yè)價(jià)值,然而對(duì)于制造業(yè)來(lái)說(shuō),乃處在起步甚至是研究階段。因此,大力發(fā)展制造業(yè)大數(shù)據(jù)技術(shù),挖掘制造業(yè)大數(shù)據(jù)的最大價(jià)值,促進(jìn)制造業(yè)的轉(zhuǎn)型升級(jí)將是制造企業(yè)下一階段的重要任務(wù)與課題。
參考文獻(xiàn)
[1] 迪莉婭.我國(guó)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展研究[J].科技進(jìn)步與對(duì)策,2014,31(4):56-60.
[2] MANYIKA J,CHUI M,BROWN B,et al.Big data:the next frontier for innovation,competition,and productivity[M].New York:Mc Kinse & Company,2011.
[3] EKBLA H,MATTLOLL M,KOUPER I.Big Data,Bigger Dilemmas:A Critical Review[J].Journal of the Association for Information Science and Technology,2015(8).
[4] 王冰.大型流程工業(yè)集團(tuán)級(jí)生產(chǎn)數(shù)據(jù)平臺(tái)的應(yīng)用探討[J].科技與企業(yè),2014(1):129-130.
[5] 邵景鋒,賀興時(shí),王進(jìn)富,等.大數(shù)據(jù)環(huán)境下的紡織制造執(zhí)行系統(tǒng)設(shè)計(jì)[J].機(jī)械工程學(xué)報(bào),2015(5):160-170.
[6] 中國(guó)電機(jī)工程學(xué)會(huì)信息化專(zhuān)委會(huì).中國(guó)電力大數(shù)據(jù)發(fā)展白皮書(shū)[M].北京:中國(guó)電力出版社,2013(11).
[7] Bello-Orgaz G,JUNG J J,CAMACHO D.Social big data:Recent achievements and new challenges[J].Information Fusion,2015(8).
[8] 楊水利,梁永康.制造企業(yè)服務(wù)化轉(zhuǎn)型影響因素扎根研究[J].科技進(jìn)步與對(duì)策,2016,33(8):101-105.
[9] KRUMEICH J,SCHIMMELPFENNIG J,JACOBI S.Advanced planning and control of manufacturing processes in steel industy though Big Data analytics[J].2014 IEEE International Conference on Big Data:2014.
[10] 趙剛.大數(shù)據(jù)技術(shù)與實(shí)踐指南[M].北京:電子工業(yè)出版社,2013.
[11] 王淑芬.基于大數(shù)據(jù)的制造運(yùn)行監(jiān)測(cè)與分析平臺(tái)研究[D].廣州:廣東工業(yè)大學(xué),2014.
[12] 楊正益.制造物聯(lián)海量實(shí)時(shí)數(shù)據(jù)處理方法研究[D].重慶:重慶大學(xué),2012.
[13] 郭偉.大數(shù)據(jù)及其在供應(yīng)鏈中的應(yīng)用.供應(yīng)鏈管理[J].2015(5):200-220.
[14] 彭小圣,鄧迪元,程時(shí)杰,等.面向智能電網(wǎng)應(yīng)用的電力大數(shù)據(jù)關(guān)鍵技術(shù)[J].中國(guó)電機(jī)工程學(xué)報(bào),2015(2):503-511.
[15] 樓巍.面向大數(shù)據(jù)的高維數(shù)據(jù)挖掘技術(shù)研究[D].上海:上海大學(xué),2013.
[16] Apache.HDFS Architecture.http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/Hdfs Design.html#Introduction.
[17] 蔡斌,陳湘萍.Hadoop技術(shù)內(nèi)幕:深入解析Hadoop Common和HDFS架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)原理[M].北京:機(jī)械工業(yè)出版社,2013.
[18] WHITE T.Hadoop:The Definitive Guide[M].O’Reilly Media,Inc,1005 Gravenstein Highway North,Sebastopol,CA95472,2009(7).
[19] KUMAR R.Two computational paradigm for big data[EB/OL].2012,http://kdd2012.sigkdd.org/sites/images/summerschool/Ravi-Kumar.pdf.
[20] 徐飛.大數(shù)據(jù)流的實(shí)時(shí)處理研究[D].無(wú)錫:江南大學(xué),2014.
[21] 崔星燦,禹曉輝,劉洋,等.分布式流處理技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2015,52(2):318-332.
[22] Aga.J.Yahoo!S4分布式流處理引擎分析總結(jié)[EB/OL].http://www.cnblogs.com/aga-j/archive/2012/02/03/233-7151.html.2012(2).
[23] 孫柏林.“大數(shù)據(jù)”技術(shù)及其在電力行業(yè)中的應(yīng)用[J].電氣時(shí)代,2013(8):18-23.
[24] 工業(yè)和信息化部電信研究院.大數(shù)據(jù)白皮書(shū)(2014年)[R].工業(yè)和信息化部電信研究院,2014(5).
[25] 唐澤圣,陳莉,鄧俊輝.三維數(shù)據(jù)場(chǎng)可視化[M].北京:清華大學(xué)出版社,1999:1-6.
作者信息:
李少波1,2,陳永前1
(1.貴州大學(xué) 現(xiàn)代制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽(yáng)550025;2.貴州大學(xué) 機(jī)械工程學(xué)院,貴州 貴陽(yáng)550025)