123,123,123

搭配Hadoop巨量储存架构　半导体设备提高生产效能

日期： 2015-07-27

關(guān)鍵詞： 半导体制程感测器晶圆半导体产业

　　半導(dǎo)體制程邁入20奈米以下技術(shù)節(jié)點后，良率、生產(chǎn)周期及成本管控的挑戰(zhàn)更加艱鉅；新式Hadoop資料儲存架構(gòu)可讓半導(dǎo)體廠以更低成本達成巨量資料儲存，進而利用深入的統(tǒng)計分析實現(xiàn)更精準(zhǔn)有效的設(shè)備管理，提高產(chǎn)線運作效率。

　　近年來，為收集更多感測器資料，長時間保留資料，并加以有效運用，制造商面對不斷加重的挑戰(zhàn)。例如最先進晶圓廠的工具感測器和故障偵測生產(chǎn)資料庫，保留資料1至3個月需要20?30兆位元組的儲存容量。隨著產(chǎn)業(yè)轉(zhuǎn)移至20奈米以下技術(shù)制造和新世代工具，情況將加劇。

　　收集和儲存資料，對于達到必要的良率、生產(chǎn)周期時間和成本至關(guān)重要，但這只是資料問題的一部分。另外更重要的是，如何經(jīng)由快速及具成本效益來分析這些資料，改善機臺的效能和工廠產(chǎn)出的良率即時的資料分析，對于找出最佳化機會、大幅加快目前的速度，具絕對關(guān)鍵性影響。

　　所幸資料管理、資料分析技巧和預(yù)測技術(shù)的演進，為半導(dǎo)體產(chǎn)業(yè)提供滿足這些需求、具有前景的全新解決方案。

　　傳統(tǒng)感測器儲存　無法處理巨量資料

　　感測器及統(tǒng)計資料所使用的分析軟體，必須使用一或多個工具、特定時間范圍、感測器、統(tǒng)計資料、配方表、批量、晶圓組合等構(gòu)成的述詞，進行資料庫查詢。但目前的資料儲存策略，以述詞查詢巨量資料(Big Data)集，無法獲得最佳結(jié)果。因此，資料大規(guī)模成長導(dǎo)致嚴(yán)重問題，影響感測器資料的儲存，也無法有效執(zhí)行分析查詢。

　　首當(dāng)其沖的問題是，要將來自數(shù)百或甚至數(shù)千個工具的資料傳送到中央儲存系統(tǒng)，需有高效能的儲存系統(tǒng)。但以目前的儲存技術(shù)與價位，要儲存數(shù)百TB的資料，將大幅提高晶圓廠級設(shè)備工程解決方案(EES)的基礎(chǔ)設(shè)施成本。以400兆位元組的企業(yè)級中央儲存系統(tǒng)為例，每兆位元組所需成本，是具備類似備援功能同等級本機附加儲存的四倍之多。

　　第二個問題是，多數(shù)感測器資料的結(jié)構(gòu)與儲存，都采用傳統(tǒng)關(guān)聯(lián)式的列與欄方式。但資料容量暴增后，這項方式卻無法隨著最新故障偵測、預(yù)測及產(chǎn)能分析應(yīng)用程式擴充，達到所需效能等級。運用傳統(tǒng)關(guān)聯(lián)式資料處理技術(shù)處理大量資料，成本將高得驚人，嚴(yán)重影響新世代應(yīng)用的投資報酬率。

　　Hadoop有效處理巨量資料

　　過去幾年里，資料管理技術(shù)方面的進展，為社交媒體、零售及財務(wù)等須管理大量資訊的產(chǎn)業(yè)開啟可能性，能以更有效率的方式，管理感測器及其他半導(dǎo)體制造資料。舉例來說，其中一個解決方案是Apache Hadoop，這是一種開放源碼軟體架構(gòu)，用于儲存及處理分散于硬體商品叢集上的大量資料。其概念可兼顧大量資料儲存，同時以更低的成本，加速完成資料處理。此開放源碼軟體平臺，主要包含Hadoop分散式檔案系統(tǒng)(HDFS)和運算架構(gòu)，可于分散式檔案系統(tǒng)上平行運算。Hadoop分散式檔案系統(tǒng)，可從數(shù)十?dāng)U充到數(shù)千臺伺服器商品，將龐大資料集大范圍散布至本機附加儲存，大幅降低儲存成本。

　　查詢資料時，運算架構(gòu)將于大量資料節(jié)點上平行處理資料，將掃描大量資料集所需處理時間縮至最短；Hadoop平臺上還有其他輔助技術(shù)，可協(xié)助有效執(zhí)行資料消化、儲存、運用結(jié)構(gòu)化的查詢語言(SQL)查詢資料，提供安全性和類似企業(yè)資料處理需求。

　　Hadoop資料儲存，可解決目前制造環(huán)境的多項問題。首先Hadoop分散式檔案系統(tǒng)，可加入低成本的儲存裝置擴充資料儲存，因此成本僅為集中系統(tǒng)資料儲存成本的四分之一。其次，擁有較大的資料儲存，制造作業(yè)可保留及查詢的資料集，比傳統(tǒng)集中儲存庫時間更長、范圍更大。目前有些自動化和設(shè)備工程系統(tǒng)公司提出要求，希望能查詢最長達兩年的資料，其中所牽涉的問題從變異控管，轉(zhuǎn)變?yōu)楦钊氲馁Y料分析。

　　現(xiàn)今公司儲存的資料類型多元，包括事件、量測和影像資料等，并希望能將這些資料開放給一般的追蹤與摘要統(tǒng)計資料。最后，有些公司擁有多座采用自動化和設(shè)備工程系統(tǒng)解決方案的晶圓廠，因此需在晶圓廠之間分享及傳送結(jié)果，必須找一個集中儲存位置以查詢和挖掘，從多間晶圓廠診斷出結(jié)果。

　　半導(dǎo)體制造可善用巨量資料

　　半導(dǎo)體設(shè)備商目前正開發(fā)多個應(yīng)用程式，以預(yù)測技術(shù)和近乎即時的資料分析為基礎(chǔ)，改善產(chǎn)能及工具效能。不過，Hadoop雖然為這些應(yīng)用程式提供分散式資料儲存及處理架構(gòu)，但卻不足以支援應(yīng)用程式的需求。

　　以下的簡短說明，可概要了解Hadoop架構(gòu)在半導(dǎo)體制造環(huán)境中的效用。為取得資料的備援及高可用性，Hadoop將資料檔案以預(yù)先定義的區(qū)塊大小，分散到數(shù)十個資料節(jié)點，如圖1所示。假如資料檔案的大小為256MB，而Hadoop區(qū)塊大小為128MB，則資料將分割為兩個區(qū)塊，每個區(qū)塊各128MB，區(qū)塊的備援副本將散布到Hadoop叢集上的多個節(jié)點。在本例中，須掃描完整檔案查詢，可在兩個平行程序中執(zhí)行。在資料時間范圍拉長，以及查詢須存取的工具數(shù)量持續(xù)成長下，使平行程度不斷成長，因此大幅提升資料擷取效率。

　　此架構(gòu)亦能對須處理大量資料集的查詢進行分割，讓部分查詢可在多個節(jié)點上平行執(zhí)行(表1)。因此即使資料容量擴大，也可大幅縮短查詢的處理時間。假設(shè)查詢述詞使用特定的時間范圍和工具集，例如用資料庫中的兩個欄，譬如時間、工具進行篩選。再假設(shè)，所需資料來自工具集所儲存的一百個感測器的其中十個。在Hadoop架構(gòu)下，查詢引擎將掃描兩個欄中經(jīng)過壓縮和連續(xù)的值，以篩選資料并從十個感測器樣本擷取輸入。引擎將不會處理工具所儲存的另外90%的感測器資料，因此可大幅減少查詢引擎所須掃描的資料量。

　　Hadoop是專為大規(guī)模儲存及分析所設(shè)計，晶圓廠目前多數(shù)的資料處理需求，則是獲得小型資料集的最佳效能。其常見使用個案包含傳統(tǒng)報告、模擬和配置功能，這些功能在自動化和設(shè)備工程系統(tǒng)內(nèi)都可找到；添購HDFS須與其他的自動化和設(shè)備工程應(yīng)用程式整合。報告及模擬環(huán)境須要從短期和長期的資料儲存位置進行查詢、合并資料，再透過標(biāo)準(zhǔn)介面回報，部分半導(dǎo)體公司并不希望HDFS資料使用新的使用者介面。

　　半導(dǎo)體公司可透過HDFS存取更大量資料集，并希望能執(zhí)行進階的資料分析活動。運用更大型資料集的新興解決方案，將可橫跨多個維護事件、橫跨多個工具，執(zhí)行反應(yīng)匹配及指紋辨識，亦能將多項叢集分析技巧，套用至追蹤及摘要統(tǒng)計資料，譬如比對正確與錯誤，以及觀察的趨勢，一般而言，這需一年以上的資料才有效。

　　添購Hadoop基礎(chǔ)設(shè)施，加入自動化和設(shè)備工程系統(tǒng)，仍有其挑戰(zhàn)。尤其相較于關(guān)聯(lián)式資料庫系統(tǒng)，半導(dǎo)體產(chǎn)業(yè)對Hadoop基礎(chǔ)設(shè)施較不熟悉，也無同樣深入的經(jīng)驗。為能普及運用，Hadoop系統(tǒng)執(zhí)行查詢及報告的效能，必須跟上關(guān)聯(lián)式系統(tǒng)的水平。再加上其基礎(chǔ)設(shè)施有著不同于關(guān)聯(lián)式系統(tǒng)的要求，而在半導(dǎo)體公司采用這些解決方案的同時，也須提供資料安全性模式和受控制資料存取等功能。

　　運用Hadoop平臺執(zhí)行大規(guī)模分析資料處理，有潛力可解決半導(dǎo)體產(chǎn)業(yè)資料爆炸性成長的問題，其低成本的儲存與資料處理，能收集大量的感測器資料，若要能運用這些資料，便須開發(fā)出合適的資料格式、架構(gòu)和查詢引擎，半導(dǎo)體制造商才能善加利用。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

搭配Hadoop巨量储存架构 半导体设备提高生产效能

日期： 2015-07-27

相關(guān)內(nèi)容

搭配Hadoop巨量储存架构　半导体设备提高生产效能