中國國家圖書館(以下簡稱國圖)位于北京市海淀區(qū)白石橋南長河畔,紫竹院公園旁。坐落在中關村南大街33號。建筑面積26萬平方米,國家圖書館的主樓為雙塔形高樓,通體以藍色為基調(diào),取其用水慎火之意。主樓采用雙重檐形式,孔雀藍琉璃瓦大屋頂,淡乳灰色的瓷磚外墻,花崗巖基座的石階,再配以漢白玉欄桿,地上書庫19層,地下書庫3層,書庫建筑面積6萬平方米,設計藏書能力2000萬冊。 裙樓分布在主樓兩側(cè),并形成兩個面積甚大的天井,天井內(nèi)為花園,形成樓中有園的獨特景致,裙樓地上5層地下1層,分布著圖書館的各個功能單元,設有各具特色的閱覽室46個,其中開架閱覽室23個,日均可接待讀者六、七千人次。
中國國家圖書館的自動化建設起步于70年代中期。1989年大型計算機綜合管理系統(tǒng)啟動,進行圖書館自動化應用系統(tǒng)的開發(fā)與實踐。從1995年開始,按照數(shù)字化、網(wǎng)絡化建設的思路,國圖制定了《國家圖書館網(wǎng)絡建設發(fā)展規(guī)劃(1997-2000)》,在網(wǎng)絡建設、軟件開發(fā)、數(shù)據(jù)加工等方面開展攻關。1999年2月,國圖在中國國內(nèi)圖書館界率先采用先進的千兆位以太網(wǎng)絡技術(shù),開通了擁有3000個信息節(jié)點的館域網(wǎng),將各個應用子系統(tǒng)連接起來。在互聯(lián)網(wǎng)建設方面,開通了國際互聯(lián)網(wǎng)中國國家圖書館站點;分別與國務院辦公廳、清華大學、北京大學等實現(xiàn)了100M速率的專線聯(lián)接;與中國計算機公用網(wǎng)、中國教育科研網(wǎng)、中國科技網(wǎng)及北京有線電視網(wǎng)、國家廣播電影電視總局全國有線電視網(wǎng)、網(wǎng)通等實現(xiàn)了高速互聯(lián),使國家圖書館初步建成網(wǎng)上信息資源的中心樞紐。
作為互聯(lián)網(wǎng)上重要的信息內(nèi)容提供者,國圖很早就意識到了自己在中文數(shù)字資源建設與服務方面的重要責任。從1987年起,國家圖書館開始致力于電子出版物的收集與館藏書目數(shù)據(jù)庫的建設,2000年起開始有計劃地進行館藏特色資源的數(shù)字化建設。2005年10月,由國家圖書館主持建設的國家數(shù)字圖書館工程獲得國務院批準開始建設,工程明確提出了建設世界上最大的中文數(shù)字信息保存基地和中文數(shù)字信息服務基地的目標。目前正在進行的一期維修改造工程完成后,建成的數(shù)字化圖書館的非結(jié)構(gòu)數(shù)據(jù)存儲量將達到800TB左右。隨著國圖數(shù)字化進程的日趨完善,海量數(shù)據(jù)、安全等問題也日益突顯。本期訪談我們就走進國圖,中央控制室主任于洪波的最新文章">于洪波將為我們揭示國圖數(shù)字化背后的秘密。
國家圖書館中央控制室主任于洪波
海量數(shù)據(jù)“存”與“用”
數(shù)字圖書館是當今世界各國視為國家信息基礎設施建設、知識、創(chuàng)新體系和創(chuàng)新能力的重要組成部分。國家圖書館從1995年起開始跟蹤研發(fā)數(shù)字圖書館,1998年向文化部提出申請,要求在國家立項實施“中國數(shù)字圖書館工程”,同時著手進行數(shù)字資源建設,已建成相當規(guī)模的數(shù)字資源量,其中部分已經(jīng)為社會提供服務。
國圖的整體建筑作為智能建筑,網(wǎng)絡數(shù)據(jù)主機房是圖書館的“心臟”,所有業(yè)務的正常運行都依賴于網(wǎng)絡的可靠連接及設備的正常運行。國圖對于網(wǎng)絡的可靠性、安全性、可拓展性等各方面有著高標準的要求。于洪波詳細介紹道:“館內(nèi)的信息點多達幾千個,信息點支撐起整個國圖機房的數(shù)據(jù)中心主干。目前,國圖有近百臺服務器、上千臺PC連接到館域網(wǎng)。其中,有328臺連接到互聯(lián)網(wǎng),此外,ALEPH 500計算機綜合管理系統(tǒng)早已全面投入運行。如今,國圖網(wǎng)上讀者已逾千萬人次,平均每天有超過50萬人次左右。而且隨著國家圖書館千兆館域網(wǎng)的正式開通和大量文獻數(shù)字化,讀者通過終端能快速檢索館藏古今中外圖書、期刊、電子出版物、視聽資料等各種文獻,而這一切都要歸功于國家圖書館的數(shù)字信息化的建設。”
數(shù)字化圖書館發(fā)展的根本是資源的數(shù)字化。大數(shù)據(jù)促使數(shù)據(jù)產(chǎn)生的范圍、方式、途徑發(fā)生翻天覆地的變化,人們的一舉一動、一言一行、行為規(guī)律等都將產(chǎn)生出大量的半結(jié)構(gòu)化、非結(jié)構(gòu)化信息數(shù)據(jù),信息數(shù)據(jù)的組成結(jié)構(gòu)、類型格式、存在形態(tài)等都愈加復雜。對于數(shù)字圖書館而言,對這些復雜數(shù)據(jù)進行的應用、存儲、分析將面臨著更大的難題。
數(shù)據(jù)量的急劇增長就需要面臨兩方面的挑戰(zhàn)一個是“存”,另一個是“用”。“存”要求數(shù)據(jù)的完整、持久,“用”的含義是及時、有效。這也是國家圖書館大數(shù)據(jù)存儲面臨和需要應對的問題。于洪波介紹道:“國圖目前面臨的問題之一是非結(jié)構(gòu)化數(shù)據(jù)的存儲。國圖中央控制室視頻存儲數(shù)據(jù)量巨大,達800T到900T。國圖數(shù)據(jù)存儲介質(zhì)最早是磁帶,這種方式檢索和經(jīng)營成本很大。此外,大磁盤陣列的方式國圖使用得也比較多,但是,它有一個弊端在于高熱量的情況下磁鐵就會被破壞。另外一種方式是固態(tài)硬盤,但是也有一定的局限性。光盤的存儲形式好處比較多,刻錄后內(nèi)容永久寫入,不易被篡改。目前,以‘光存儲’數(shù)據(jù)的主要介質(zhì)是國圖的‘縮微膠片’。‘光存儲’是文獻、資料數(shù)字化的一種表現(xiàn)形式,同‘電’存儲和‘磁’存儲相比,其穩(wěn)定、不易修改、抗擊強電磁場和強磁電場干擾、抗擊熱沖擊的特點比較突出,同時可以完全抗擊網(wǎng)絡黑客和病毒的攻擊,成本也較為低廉。”對于大數(shù)據(jù)量的存儲,于洪波認為,既要考慮到現(xiàn)實情況,也應該看到未來長遠的趨勢,應該具有一定的前瞻性。
云計算改良安全環(huán)境尚待時日
國圖每年大約要接待海內(nèi)外讀者400多萬人次。國圖的藏書可上溯到700多年前的南宋皇家緝熙殿藏書,最早的典藏可以遠溯到3000多年前的殷墟甲骨。截至到2005年,國圖的藏書容量達2500多萬冊,其中價值連城的古籍善本就有200余萬冊。圖書館即作為一種提供服務的公共場所,又作為珍藏著大量的珍貴文物的特殊場所,如何保障人員安全、資源安全,成為數(shù)字圖書館時代,國圖需要首先解決的難題。此時樓宇的整體安全防范建設就顯得尤為重要。
國圖的智能建筑,由主機房進行全面的管控,針對公共服務的網(wǎng)絡環(huán)境,國圖主機房安全防控進行了細致的布置:主機房采用了感煙探測器。當設有固定滅火系統(tǒng)時,采用感煙、感溫兩種探測器的組合;當主機房內(nèi)設置空調(diào)設備時,應受主機房內(nèi)電源切斷開關的控制,機房內(nèi)的電源切斷開關最大限度地靠近工作人員的操作位置和主要出入口。在智能樓宇的公共安全方面,國圖新館的公共安全防范系統(tǒng)(SafetyAutomation System,SAS)已經(jīng)啟用,主要包含入侵報警系統(tǒng)、閉路監(jiān)控系統(tǒng)、門禁系統(tǒng)、電子巡更系統(tǒng)以及公共安全防范綜合管理系統(tǒng)等五個子系統(tǒng)。這一系統(tǒng)的啟用在加強內(nèi)部管理同時,也為人們提供了一個更加安全寧靜的讀書環(huán)境。后端監(jiān)控中心配備有兩臺UPS電源,當遇到圖書館意外停電時,UPS電源負責對所有網(wǎng)絡視頻監(jiān)控系統(tǒng)設備進行集中供電,保證監(jiān)控系統(tǒng)能夠繼續(xù)正常運行2個小時。監(jiān)控系統(tǒng)通過光纖高速接入中央控制室,管理者可通過館域網(wǎng)調(diào)看錄像或?qū)崟r監(jiān)看各個監(jiān)控畫面,實現(xiàn)高效管理。
信息時代的圖書館應該是高度信息化的圖書館,在談到自動控制系統(tǒng)今后的發(fā)展方向時,于洪波認為未來一定是以處理各種探測信息和數(shù)據(jù)為核心的控制系統(tǒng),這些數(shù)據(jù)會隨著探測器技術(shù)的發(fā)展而發(fā)展,信息探測技術(shù)會隨著探測器技術(shù)的更新而更新,所以安全防范系統(tǒng)的消防自動控制系統(tǒng)和安防自動控制系統(tǒng),逐漸趨于一個平臺進行管理,這時就會應用到云計算技術(shù)。打破各個系統(tǒng)之間的壁壘,在一個平臺上統(tǒng)一進行管理。但是,在此之前,如果對各個系統(tǒng)進行數(shù)據(jù)庫整合還是一個尚待解決的問題。如何實現(xiàn)云計算在數(shù)字圖書館安全防范中的應用還尚需時日。