摘 要: 如何把分散的信息有效組織起來(lái),實(shí)現(xiàn)跨部門(mén)、跨地區(qū)的信息共享,是金盾工程建設(shè)必須解決的一個(gè)關(guān)鍵問(wèn)題。主要介紹如何圍繞“人、地、物、事件、組織”治安信息五要素的業(yè)務(wù)模型,利用Web Services、UDDI等技術(shù)創(chuàng)建智能搜索引擎,實(shí)現(xiàn)全省范圍內(nèi)治安信息五要素關(guān)聯(lián)查詢(xún)及異構(gòu)系統(tǒng)間的全網(wǎng)漫游。
關(guān)鍵詞: 治安信息五要素;關(guān)聯(lián)查詢(xún);異構(gòu)系統(tǒng);數(shù)據(jù)漫游
近年來(lái),公安信息系統(tǒng)從簡(jiǎn)單的信息處理向以數(shù)據(jù)為中心的數(shù)據(jù)共享和關(guān)聯(lián)的復(fù)雜應(yīng)用轉(zhuǎn)變,治安信息五要素智能搜索引擎就是采用先進(jìn)的計(jì)算機(jī)技術(shù)如Web Services、SOAP、UDDI、XML、WSDL、分布式技術(shù)等構(gòu)建的應(yīng)用系統(tǒng),旨在實(shí)現(xiàn)全省范圍內(nèi)人、地、物、組織、事件的關(guān)聯(lián)查詢(xún)及異構(gòu)系統(tǒng)間的全網(wǎng)漫游;實(shí)現(xiàn)分布在全省不同地方的不同系統(tǒng)間或系統(tǒng)本身的五要素關(guān)聯(lián)查詢(xún),并能實(shí)現(xiàn)定義與發(fā)現(xiàn)異構(gòu)數(shù)據(jù)源,能自定義搜索條件與搜索結(jié)果的展現(xiàn)方式,容易和其他系統(tǒng)對(duì)接。治安信息智能搜索引擎的成功實(shí)施推動(dòng)全省公安信息化的發(fā)展。
1 治安信息五要素模型
1.1 五要素關(guān)系模型
隨著全國(guó)公安信息化建設(shè)的深入,國(guó)內(nèi)各級(jí)公安在實(shí)踐的基礎(chǔ)上,總結(jié)出治安信息的五要素模型為[1]:人、地、物、組織、事件。人指自然人;地指地理位置;物指生物或非生物;組織是一種社會(huì)實(shí)體,它是人、地、物等要素之間的一種穩(wěn)態(tài)關(guān)系;事件是導(dǎo)致人、地、物、組織等要素關(guān)系發(fā)生變化的特殊要素,即事件使各要素從一種相對(duì)穩(wěn)態(tài)關(guān)系轉(zhuǎn)變?yōu)榱硪环N相對(duì)穩(wěn)態(tài)關(guān)系。事件是體現(xiàn)動(dòng)態(tài)和關(guān)聯(lián)的重要環(huán)節(jié),只有處理好事件的表述方式,才可以將五要素信息進(jìn)行有機(jī)的組織,達(dá)到體現(xiàn)“動(dòng)態(tài)全息”的目的。五要素關(guān)系模型見(jiàn)圖1。
理想情況下,同一實(shí)體在全省公安系統(tǒng)(甚至在全國(guó)公安系統(tǒng))中應(yīng)只有一個(gè)對(duì)應(yīng)要素,所有要素可以唯一標(biāo)識(shí),要素之間的各種聯(lián)系是有機(jī)和完整的。但在實(shí)際條件約束下,由于種種原因?qū)е乱氐闹貜?fù)創(chuàng)建:公安不同的應(yīng)用系統(tǒng)可能對(duì)同一實(shí)體分別在本系統(tǒng)內(nèi)重復(fù)創(chuàng)建對(duì)應(yīng)要素;以地市級(jí)為中心建立治安信息系統(tǒng)時(shí),導(dǎo)致同一實(shí)體在不同城市系統(tǒng)內(nèi)創(chuàng)建對(duì)應(yīng)要素等。所以,為簡(jiǎn)單起見(jiàn),這里假定治安管理信息“五要素”業(yè)務(wù)模型為:地市內(nèi)各治安業(yè)務(wù)之間做到要素唯一創(chuàng)建、唯一標(biāo)識(shí)、末態(tài)屬性唯一、有機(jī)關(guān)聯(lián);地市之間,要素可以重復(fù)創(chuàng)建,通過(guò)唯一標(biāo)識(shí)彼此識(shí)別,進(jìn)一步獲取要素的各方面信息;提供與數(shù)據(jù)庫(kù)、文件服務(wù)器間的交互支持,提供數(shù)據(jù)存儲(chǔ)與業(yè)務(wù)對(duì)象的映射,通過(guò)“五要素”業(yè)務(wù)模型協(xié)助解決數(shù)據(jù)庫(kù)在性能與訪(fǎng)問(wèn)平衡中的問(wèn)題,實(shí)現(xiàn)數(shù)據(jù)庫(kù)組織策略調(diào)整對(duì)業(yè)務(wù)系統(tǒng)的無(wú)關(guān)性。
1.2 五要素?cái)?shù)據(jù)分布
目前全省范圍內(nèi)治安信息系統(tǒng)分布在省廳、各地州、各縣區(qū)和各派出所。有些系統(tǒng)是使用省中心庫(kù),如省級(jí)人口信息系統(tǒng);有些是使用地市集中庫(kù),如重點(diǎn)人口系統(tǒng);有些是工作數(shù)據(jù)庫(kù)分布在派出所,再將數(shù)據(jù)庫(kù)集中到區(qū)縣庫(kù)和地州庫(kù),如現(xiàn)有的實(shí)有人口管理系統(tǒng)。五要素?cái)?shù)據(jù)分布網(wǎng)絡(luò)結(jié)構(gòu)模型見(jiàn)圖2。
從圖2可以看出,五要素?cái)?shù)據(jù)可能分布在不同的地理位置和存儲(chǔ)于不同的系統(tǒng)中,公安機(jī)關(guān)各職能部門(mén)通常都有自己的應(yīng)用系統(tǒng),而且建設(shè)模式基本上覆蓋了省、地市、區(qū)縣、派出所四級(jí)應(yīng)用。智能搜索引擎就是要實(shí)現(xiàn)跨部門(mén)、跨區(qū)域和異構(gòu)數(shù)據(jù)的漫游查詢(xún),以Web Service的方式為治安工作人員提供統(tǒng)一的操作界面,屏蔽平臺(tái)的差異性。
2 治安信息五要素智能搜索引擎體系結(jié)構(gòu)
從上述模型來(lái)看,如此龐大的治安管理信息系統(tǒng),各自的實(shí)現(xiàn)方式是不同的,如何有效地控制調(diào)用這些不存在主從關(guān)系的子系統(tǒng)、事務(wù)和模塊,如何組織動(dòng)態(tài)的鏈接、模塊之間如何通信等,是智能搜索引擎需解決的主要問(wèn)題,因此提出如圖3所示的體系結(jié)構(gòu)。
整個(gè)搜索引擎分為3個(gè)層次:用戶(hù)層、應(yīng)用層和數(shù)據(jù)層。其中,用戶(hù)層只和用戶(hù)交互,不進(jìn)行任何業(yè)務(wù)處理,實(shí)際上就是只有客戶(hù)端。應(yīng)用層包含系統(tǒng)中業(yè)務(wù)邏輯的實(shí)現(xiàn)和數(shù)據(jù)訪(fǎng)問(wèn)控制。應(yīng)用層由.net程序及XML Web Services 實(shí)現(xiàn),并使用SOAP協(xié)議與客戶(hù)端連接。應(yīng)用層中的事務(wù)日志、用戶(hù)狀態(tài)管理、五要素?cái)?shù)據(jù)源與數(shù)據(jù)表現(xiàn)定義、管理工具、主搜索引擎、五要素資源注冊(cè)中心等都在省中心應(yīng)用服務(wù)器上運(yùn)行,搜索數(shù)據(jù)庫(kù)分布在省中心數(shù)據(jù)庫(kù)服務(wù)器上運(yùn)行。智能搜索引擎中,應(yīng)用層的主要功能如下[2]。
(1)單點(diǎn)登錄和用戶(hù)狀態(tài)管理:用戶(hù)只需一次登錄系統(tǒng),就能操作權(quán)限范圍內(nèi)的功能菜單,并為每一個(gè)登錄的用戶(hù)保存狀態(tài)信息和記錄用戶(hù)的查詢(xún)操作信息。
(2)五要素?cái)?shù)據(jù)源配置與數(shù)據(jù)表現(xiàn)自定義管理:對(duì)新接入的系統(tǒng)進(jìn)行數(shù)據(jù)源配置,系統(tǒng)不用修改程序代碼便可掛接新系統(tǒng),用戶(hù)可自定義查詢(xún)結(jié)果展現(xiàn)方式。
(3)分析處理器:接收并分析用戶(hù)的查詢(xún)請(qǐng)求,訪(fǎng)問(wèn)UDDI注冊(cè)中心,調(diào)用搜索引擎,并返回?cái)?shù)據(jù)。
(4)主搜索引擎:搜索任務(wù)分配的中心調(diào)度器。系統(tǒng)從客戶(hù)端接收到查詢(xún)請(qǐng)求后,主搜索引擎便對(duì)查詢(xún)請(qǐng)求進(jìn)行分析,把任務(wù)分發(fā)到對(duì)應(yīng)的子搜索引擎,從子搜索引擎接收數(shù)據(jù),并返回客戶(hù)端數(shù)據(jù)。主搜索引擎與各子搜索引擎定時(shí)互發(fā)路由消息,以便主搜索引擎掌握各子搜索引擎的路由情況。
(5)子搜索引擎:實(shí)現(xiàn)用戶(hù)定義系統(tǒng)的接入,并把相關(guān)信息發(fā)送到中心;承擔(dān)主搜索引擎發(fā)送來(lái)的查詢(xún)?nèi)蝿?wù),并返回主搜索引擎所需數(shù)據(jù);定時(shí)發(fā)送路由信息給主搜索引擎,以便主搜索引擎掌握各子搜索引擎的路由情況。
(6)五要素同級(jí)分布搜索:對(duì)該子搜索引擎管轄范圍內(nèi)的同一地區(qū)級(jí)的數(shù)據(jù)庫(kù)進(jìn)行搜索。
(7)系統(tǒng)間和子系統(tǒng)五要素關(guān)聯(lián)查詢(xún):系統(tǒng)與系統(tǒng)間的關(guān)聯(lián)查詢(xún),統(tǒng)一系統(tǒng)內(nèi)五要素的關(guān)聯(lián)查詢(xún),并返回?cái)?shù)據(jù)。
(8)數(shù)據(jù)源適配器:調(diào)用與目標(biāo)數(shù)據(jù)庫(kù)對(duì)應(yīng)的驅(qū)動(dòng)程序,直接與數(shù)據(jù)庫(kù)打交道,向數(shù)據(jù)庫(kù)發(fā)送查詢(xún)命令,并取得數(shù)據(jù)的模塊。
(9)五要素漫游搜索:有異步返回?cái)?shù)據(jù)功能,當(dāng)子搜索引擎接收到漫游查詢(xún)后,啟動(dòng)五要素漫游搜索線(xiàn)程,在足夠多的時(shí)間內(nèi)搜索目標(biāo)數(shù)據(jù)庫(kù),將搜索所得的數(shù)據(jù)放入漫游數(shù)據(jù)隊(duì)列,并返回給主搜索引擎。
(10)五要素資源注冊(cè)中心:對(duì)主搜索引擎注冊(cè),使得主搜索引擎通過(guò)注冊(cè)中心被系統(tǒng)程序發(fā)現(xiàn)和調(diào)用。
采用Web Services[3,4]技術(shù)將功能組件封裝成一個(gè)整體的服務(wù),以UDDI的方式注冊(cè)發(fā)布。通過(guò)五要素引擎把所有的程序組織起來(lái),把物理位置分布不同、運(yùn)行環(huán)境不同、功能相對(duì)獨(dú)立的系統(tǒng)信息統(tǒng)一起來(lái),模塊之間的搭線(xiàn)連接由搜索引擎去實(shí)現(xiàn);系統(tǒng)對(duì)用戶(hù)而言以瀏覽器為表現(xiàn)方式,網(wǎng)絡(luò)就是一個(gè)面向服務(wù)的大計(jì)算機(jī),這就突破了傳統(tǒng)的分布式計(jì)算模型在通信、應(yīng)用范圍等方面的限制。這就是五要素智能搜索引擎“無(wú)所不在的計(jì)算”的核心思想。
3 智能搜索引擎關(guān)鍵技術(shù)介紹
3.1 分布式數(shù)據(jù)適配器
治安信息智能搜索引擎涉及的業(yè)務(wù)數(shù)據(jù)量大,而且這些數(shù)據(jù)廣泛分布在不同的應(yīng)用系統(tǒng)中,每個(gè)系統(tǒng)采用的數(shù)據(jù)庫(kù)可能不相同,要訪(fǎng)問(wèn)這些數(shù)據(jù)庫(kù),不可能為每種數(shù)據(jù)庫(kù)分別編寫(xiě)數(shù)據(jù)訪(fǎng)問(wèn)代碼,而且搜索引擎有時(shí)需要同時(shí)訪(fǎng)問(wèn)多種數(shù)據(jù)庫(kù)。為此,專(zhuān)門(mén)設(shè)計(jì)實(shí)現(xiàn)了一個(gè)數(shù)據(jù)適配器,用于訪(fǎng)問(wèn)分布式的異構(gòu)數(shù)據(jù)庫(kù)[5],其實(shí)現(xiàn)框架如圖4所示。
分布式數(shù)據(jù)適配器綜合利用線(xiàn)程技術(shù)、Web Service技術(shù)和搜索引擎提供的統(tǒng)一數(shù)據(jù)訪(fǎng)問(wèn)器和路由表服務(wù)實(shí)現(xiàn)五要素信息的漫游查詢(xún)。
3.2 系統(tǒng)之間接口標(biāo)準(zhǔn)和五要素元數(shù)據(jù)標(biāo)準(zhǔn)
系統(tǒng)把各種異構(gòu)數(shù)據(jù)按五要素模型標(biāo)準(zhǔn)建模,由各種異構(gòu)數(shù)據(jù)自身體現(xiàn)五要素的內(nèi)外聯(lián)系,使得搜索引擎以統(tǒng)一的接口處理各種異構(gòu)業(yè)務(wù)數(shù)據(jù)。首先,將各種系統(tǒng)按五要素分類(lèi),并以某些關(guān)鍵字的組合關(guān)聯(lián)起來(lái);再次,將系統(tǒng)中的各種表信息按五要素分類(lèi),并以系統(tǒng)內(nèi)部的某些關(guān)鍵字關(guān)聯(lián)起來(lái);最后,用特定的標(biāo)準(zhǔn)描述各種系統(tǒng)需要表現(xiàn)的具體信息,并予以定義。
3.3 分布式數(shù)據(jù)庫(kù)處理技術(shù)
搜索引擎提供通用數(shù)據(jù)訪(fǎng)問(wèn)適配技術(shù)解決分布式異構(gòu)數(shù)據(jù)庫(kù)訪(fǎng)問(wèn)難題,本技術(shù)可以有效、安全地訪(fǎng)問(wèn)部署在防火墻后的各種異構(gòu)數(shù)據(jù)庫(kù),并支持統(tǒng)一的標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)語(yǔ)言,使系統(tǒng)在統(tǒng)一數(shù)據(jù)庫(kù)語(yǔ)言標(biāo)準(zhǔn)下,從而簡(jiǎn)化了開(kāi)發(fā)難度。采用同步和異步Web Service提取數(shù)據(jù)的技術(shù)來(lái)實(shí)現(xiàn)。
3.4 搜索算法
搜索引擎算法主要有:關(guān)鍵字搜索、智能搜索路徑、智能搜索深度優(yōu)化算法等。關(guān)鍵字搜索就是利用系統(tǒng)間的關(guān)聯(lián)關(guān)鍵字對(duì)相關(guān)系統(tǒng)進(jìn)行分布式抓取數(shù)據(jù),并在主搜索引擎重組數(shù)據(jù)并表現(xiàn);智能搜索路徑是基于系統(tǒng)之間的關(guān)聯(lián),如常口系統(tǒng)與派出所綜合系統(tǒng)的關(guān)聯(lián),派出所綜合系統(tǒng)與重點(diǎn)人口的關(guān)聯(lián)等,也就是說(shuō)可以形成很多關(guān)系鏈,而這些關(guān)系鏈也許是閉合的,也許是開(kāi)放的,錯(cuò)綜復(fù)雜,所以采用智能搜索路徑,從主搜索系統(tǒng)開(kāi)始,排列不同的分支系統(tǒng),并按順序搜索數(shù)據(jù);智能搜索深度優(yōu)化根據(jù)系統(tǒng)的多少和執(zhí)行快慢,自由定義分支系統(tǒng)的搜索路徑深度,因?yàn)樗阉饕娴乃阉魇前凑找欢ǖ乃阉髀窂剿阉鞯摹?br />
3.5 治安五要素信息UDDI注冊(cè)中心
使用微軟的UDDI注冊(cè)中心作為治安五要素信息注冊(cè)中心來(lái)公布主搜索引擎服務(wù)接口。通過(guò)該接口,其他系統(tǒng)認(rèn)證后可以發(fā)現(xiàn)并使用搜索引擎的服務(wù)并得到所需要的信息。
鑒于全省治安信息數(shù)據(jù)的分布特性和各系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)的不統(tǒng)一性,本文分析了五要素?cái)?shù)據(jù)模型和元數(shù)據(jù)標(biāo)準(zhǔn),提出基于Web Service技術(shù)的治安信息五要素智能搜索引擎體系結(jié)構(gòu),并利用線(xiàn)程、UDDI、SOAP等技術(shù)實(shí)現(xiàn)五要素信息的關(guān)聯(lián)查詢(xún)和漫游查詢(xún),實(shí)現(xiàn)全省范圍內(nèi)治安信息的“一站式”搜索。智能搜索引擎的設(shè)計(jì)和實(shí)現(xiàn)充分考慮系統(tǒng)的靈活性,把業(yè)務(wù)組件封裝成Web Service與可重用性構(gòu)件,這樣系統(tǒng)具有易擴(kuò)展性。目前系統(tǒng)已投入運(yùn)行,并取得了一定的成效。但怎樣定義元數(shù)據(jù)標(biāo)準(zhǔn)才能使查詢(xún)更有效還有待進(jìn)一步研究,對(duì)多線(xiàn)程的管理控制也有待改進(jìn)。由于是基于Web Service技術(shù)實(shí)現(xiàn)的,如果把SOAP的思想用到設(shè)計(jì)中,系統(tǒng)是否更健壯等是下一步工作的內(nèi)容。
參考文獻(xiàn)
[1] 云南省公安廳.五要素引擎可行性研究報(bào)告[R].昆明:2003.
[2] 昆明世科網(wǎng)絡(luò)技術(shù)有限公司.五要素系統(tǒng)需求分析[R].昆明:2004.
[3] PAPAZOGLOU M.Web Services:principles and technology[M].Prentice Hall, 1 editon(September 23,2007).
[4] HONZLER S.XML完全探索[M].陶陽(yáng),嵩敬波,王鋒,譯.北京:中國(guó)青年出版社,2000.
[5] COYLE F P.XML、WEB服務(wù)和數(shù)據(jù)革命[M].袁勤勇,吳青,譯.北京:清華大學(xué)出版社,2003.