摘 要: 網(wǎng)絡(luò)時(shí)代提高信息服務(wù)質(zhì)量的關(guān)鍵是信息篩選。網(wǎng)絡(luò)信息影響力評(píng)價(jià)方法主要有搜索引擎收錄情況、用戶訪問量統(tǒng)計(jì)和鏈接分析法,這些方法通過定量評(píng)價(jià)網(wǎng)絡(luò)信息,有效地彌補(bǔ)了同行評(píng)議法等定性評(píng)價(jià)方法的不足。結(jié)合這些方法為用戶檢索關(guān)鍵有效信息提供了一些思路。
關(guān)鍵詞: 網(wǎng)絡(luò);關(guān)鍵信息;篩選;影響力;評(píng)估
如何從Internet資源庫(kù)中迅速準(zhǔn)確地獲取所需信息成為目前一個(gè)亟待解決的問題。搜索引擎成為目前人們獲取信息的重要途徑。面對(duì)著大量的信息,如何進(jìn)行有效處理?如何利用網(wǎng)絡(luò)篩選獲得自己所需要的信息?如何才能有效地利用這些信息?這些問題是能否高效利用現(xiàn)代化技術(shù)的至關(guān)重要的環(huán)節(jié)。然而,即使像Google和百度這樣技術(shù)先進(jìn)的通用搜索引擎巨頭仍然面臨一些棘手問題尚未解決[1]。
(1)低查準(zhǔn)率:查準(zhǔn)率和查全率一直難以兩者兼得,通用搜索引擎往往以犧牲查準(zhǔn)率來獲得較高的查全率,而這種做法對(duì)有特定信息需求的人群越來越顯得無能為力。
(2)搜索的“垂直度”問題:如何針對(duì)專業(yè)領(lǐng)域的行業(yè)需求,更精確地、深入地挖掘和獲取用戶所需信息既是一個(gè)難度很高也是一個(gè)亟待解決的現(xiàn)實(shí)問題。
1 網(wǎng)絡(luò)信息檢索的發(fā)展及其特點(diǎn)
網(wǎng)絡(luò)信息檢索系統(tǒng)的核心是搜索引擎,搜索引擎的發(fā)展史就是網(wǎng)絡(luò)信息檢索的發(fā)展史。網(wǎng)絡(luò)信息檢索呈現(xiàn)出以下幾方面的特點(diǎn):
(1)多用戶
網(wǎng)絡(luò)時(shí)代的信息資源服務(wù)從一開始就是多用戶的,在此模式下,信息檢索的服務(wù)必須注重快速反應(yīng),注重對(duì)并發(fā)訪問的支持、對(duì)公共數(shù)據(jù)的共享、對(duì)臨時(shí)工作數(shù)據(jù)的清理等。
(2)海量數(shù)據(jù)
在網(wǎng)絡(luò)環(huán)境下,信息源眾多、數(shù)據(jù)量巨大。大數(shù)據(jù)量的后果就是垃圾數(shù)據(jù)增多,而尋找1種甄別數(shù)據(jù)有效性的高效信息檢索方法就顯得尤為重要。
(3)非專業(yè)化
網(wǎng)絡(luò)環(huán)境下使用信息檢索系統(tǒng)的用戶大多都不具備專業(yè)的信息檢索技能,這些非專業(yè)用戶不能像圖書情報(bào)專家那樣熟練地使用主題詞、分類號(hào)、邏輯組合和嚴(yán)格的查詢語言來檢索網(wǎng)上的信息內(nèi)容。
2 篩選
提高信息質(zhì)量的關(guān)鍵是由于網(wǎng)絡(luò)信息資源數(shù)量繁多,包羅萬象,所以對(duì)其應(yīng)當(dāng)有選擇、有甄別地利用。網(wǎng)絡(luò)信息資源的選擇應(yīng)遵循以下原則:
(1)針對(duì)性原則。有針對(duì)地編制文摘、綜述、題錄等,通過各種交流途徑進(jìn)行傳遞報(bào)道,及時(shí)提供給用戶。
(2)科學(xué)性原則。信息資源的選擇需要采用科學(xué)的方法,高質(zhì)量的信息資源意味著它已經(jīng)過質(zhì)量的控制,已經(jīng)得到組織加工并以1種系統(tǒng)而統(tǒng)一的方式存儲(chǔ),在1個(gè)可靠的、用戶友好的檢索系統(tǒng)中提供對(duì)它們的存取。
(3)計(jì)劃性原則。對(duì)網(wǎng)絡(luò)信息的選擇要統(tǒng)籌計(jì)劃、歸類整合、制定目標(biāo)、合理管理。
(4)對(duì)特定用戶進(jìn)行跟綜服務(wù)、主動(dòng)及時(shí)地提供新穎、準(zhǔn)確、有價(jià)值、實(shí)用的專業(yè)化網(wǎng)絡(luò)信息資源。
2.1 篩選出真實(shí)信息,增強(qiáng)準(zhǔn)確性
網(wǎng)絡(luò)上收集到的信息大都來源廣泛、涉及面復(fù)雜,往往混雜著一些不真實(shí)、不準(zhǔn)確、虛假的、夸張的成份,對(duì)這一部分信息如不加以鑒別,就必然導(dǎo)致信息的不準(zhǔn)確。所以在篩選信息時(shí),要努力做到兩點(diǎn):首先搞好鑒別,判斷其真實(shí)和準(zhǔn)確程度;其次是追根溯源,一定要篩選出來重新核實(shí),最大限度地剔除其不確定因素,確保所選的資料科學(xué)、周密、準(zhǔn)確。
2.2 篩選出核心信息,增強(qiáng)服務(wù)性
在整理篩選核心資料時(shí),一要找準(zhǔn)位置,二要把握需求,根據(jù)要求,有目的地收集和選擇信息資料,并加以全面系統(tǒng)地歸納、綜合和概括;三要抓住中心,不可孤立地看待信息的“好壞”,而必須以實(shí)際需求為準(zhǔn)繩,才能把握信息的質(zhì)量。
2.3 篩選出典型資料,增強(qiáng)代表性
在文獻(xiàn)資料庫(kù)中,大部分信息是分散的、零星的、不系統(tǒng)的,反映的只是表層與局部,缺乏代表性。而要揭示事物本質(zhì)及其發(fā)展變化規(guī)律,就必須選擇具有代表性的典型材料。把收集到的大量信息加以濃縮,這樣的信息才具有代表性。
2.4 篩選出簡(jiǎn)潔資料,增強(qiáng)實(shí)用性
收集的信息資料有許多是重復(fù)多余的,只有剔除了這部分信息才便于加工整理、利用和存儲(chǔ)。在整理此信息資料時(shí),一要抓住根本點(diǎn);二要把握好尺度,有些信息資料雖然在內(nèi)容上有一定重復(fù),但也反映了事物的一些特點(diǎn),篩選時(shí)可以剔除重復(fù)部分,綜合整理出有特點(diǎn)的部分。
3 網(wǎng)絡(luò)信息影響力評(píng)價(jià)方法
網(wǎng)絡(luò)信息的急劇增長(zhǎng),需要對(duì)其進(jìn)行評(píng)價(jià)以幫助人們更好獲取與利用信息。目前對(duì)網(wǎng)絡(luò)信息的評(píng)價(jià)研究主要集中在內(nèi)容評(píng)價(jià)方面,主要評(píng)價(jià)標(biāo)準(zhǔn)有可信度、準(zhǔn)確度、客觀性、及時(shí)性、報(bào)道范圍、鏈接、文章的目的性及高效性等。
內(nèi)容評(píng)價(jià)主要采取同行專家評(píng)審法,此方法主觀性大,耗時(shí)長(zhǎng),專家的代表性與公正性難以得到有效保證。而網(wǎng)絡(luò)信息內(nèi)容是否有價(jià)值,最終都會(huì)在其對(duì)用戶行為的影響上表現(xiàn)出來,質(zhì)量較高的網(wǎng)絡(luò)信息會(huì)導(dǎo)致更多的瀏覽次數(shù),隨之而來的是更多的被鏈次數(shù),但可以通過一些具體的指標(biāo)進(jìn)行測(cè)量,定量評(píng)價(jià)網(wǎng)絡(luò)信息,有效地彌補(bǔ)同行評(píng)議法等定性評(píng)價(jià)方法的不足。利用影響力對(duì)網(wǎng)絡(luò)信息進(jìn)行評(píng)價(jià)是目前一個(gè)熱點(diǎn)課題。
目前,國(guó)內(nèi)學(xué)者認(rèn)為網(wǎng)絡(luò)信息評(píng)價(jià)主要有3種方法。第3方評(píng)價(jià)法、網(wǎng)絡(luò)信息服務(wù)用戶評(píng)價(jià)法、由文獻(xiàn)計(jì)量學(xué)引申和發(fā)展而來的網(wǎng)絡(luò)計(jì)量法。這3種方法的評(píng)價(jià)過程,實(shí)際上就是信息評(píng)價(jià)從定性方法到定量方法的過程。定性方法主要依靠評(píng)價(jià)者的主觀判斷,用于評(píng)價(jià)網(wǎng)絡(luò)新體系時(shí)難免會(huì)影響結(jié)果的客觀性,降低結(jié)果的可信度,同時(shí)也會(huì)使評(píng)價(jià)過程花費(fèi)時(shí)間較多。定量方法為人們提供系統(tǒng)客觀、規(guī)模宏大的數(shù)量分析方法,結(jié)果更加直觀、具體。由于目前網(wǎng)絡(luò)發(fā)展變化快、穩(wěn)定性差,通過定量方法得到的結(jié)果只能代表某一階段的狀況。所以,評(píng)價(jià)網(wǎng)絡(luò)信息資源時(shí)仍不能偏廢定性方法的使用,最佳方案是把定性與定量方法結(jié)合起來,這也是未來網(wǎng)絡(luò)資源評(píng)價(jià)的一個(gè)趨向。
網(wǎng)絡(luò)信息影響力評(píng)價(jià)實(shí)際涉及2個(gè)層面,一是單個(gè)網(wǎng)影響力評(píng)價(jià),二是網(wǎng)站影響力評(píng)價(jià)。因?yàn)榫W(wǎng)絡(luò)信息是以網(wǎng)站為單位發(fā)布的,網(wǎng)絡(luò)信息影響評(píng)價(jià)多是針對(duì)網(wǎng)站進(jìn)行的。網(wǎng)站影響力評(píng)價(jià)的標(biāo)準(zhǔn)與方法關(guān)系極為密切,通常是一種評(píng)價(jià)指標(biāo)就是由一種具體的方法來測(cè)定的,因此,就將評(píng)價(jià)標(biāo)準(zhǔn)與方法結(jié)合在一起,對(duì)網(wǎng)站影響力評(píng)價(jià)的方法主要有以下幾種。
3.1 搜索引擎收錄情況
搜索引擎是網(wǎng)民在互聯(lián)網(wǎng)中獲取所需信息的基礎(chǔ)應(yīng)用,從1998年起,中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)于每年1月和7月發(fā)布《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》。第23次調(diào)查統(tǒng)計(jì)數(shù)據(jù)截止日期為2008年12月31日,該次調(diào)查表明,目前搜索引擎的使用率為68.0%,在各互聯(lián)網(wǎng)應(yīng)用中位列第4。2008年全年搜索引擎用戶增長(zhǎng)了5 100萬人,年增長(zhǎng)率達(dá)到33.6%[2]。印刷型文獻(xiàn)影響評(píng)價(jià)有1個(gè)重要指標(biāo)就是被著名檢索工具(如Medine、BA、CA、Ei等)收錄情況,被其它資源收錄情況也是網(wǎng)絡(luò)信息影響力的1個(gè)重要指標(biāo)。不被搜索引擎收錄的網(wǎng)站被訪問、被利用的機(jī)會(huì)是很小的。
所以根據(jù)搜索引擎收錄情況可以評(píng)價(jià)網(wǎng)站的影響力,另外被鏈次數(shù)、被點(diǎn)擊次數(shù)、被評(píng)議過的站點(diǎn)也能促進(jìn)網(wǎng)站的排名。1個(gè)站點(diǎn)被鏈接的次數(shù)越多,證明該站點(diǎn)影響越大,質(zhì)量也越高。
3.2 用戶訪問量統(tǒng)計(jì)
用戶訪問量是對(duì)網(wǎng)絡(luò)信息進(jìn)行評(píng)價(jià)的1個(gè)客觀指標(biāo),訪問人數(shù)多是網(wǎng)絡(luò)信息價(jià)值高、可用性好的結(jié)果。目前,對(duì)用戶訪問量進(jìn)行統(tǒng)計(jì)主要有2種方法:用戶行為監(jiān)測(cè)法與服務(wù)器登錄日志(Server Access Log)分析法。用戶行為監(jiān)測(cè)法的代表是Media Metrix的網(wǎng)站及數(shù)字媒體訪問量排名。Media Metrix選擇有代表性的家庭及工作單位上網(wǎng)用戶進(jìn)行調(diào)查,在被調(diào)查用戶計(jì)算機(jī)的操作系統(tǒng)中安裝“Media Metrix Meter”監(jiān)測(cè)裝置,對(duì)用戶瀏覽網(wǎng)頁的每一次行為都進(jìn)行統(tǒng)計(jì),以此為基礎(chǔ)公布網(wǎng)站及數(shù)字媒體的訪問量排名。服務(wù)器登錄日志分析法是對(duì)服務(wù)器的訪問日志進(jìn)行分析,所有訪問者對(duì)某一網(wǎng)站的訪問情況都被記錄在網(wǎng)站服務(wù)器的“登錄日志”中,登錄日志顯示了訪問者在網(wǎng)站上的全部訪問行為。
3.3 鏈接分析法
鏈接分析法是利用某一站點(diǎn)的被鏈次數(shù)對(duì)其質(zhì)量進(jìn)行評(píng)價(jià)。被鏈次數(shù)是網(wǎng)絡(luò)信息評(píng)價(jià)重要指標(biāo)。1個(gè)站點(diǎn)被鏈接的次數(shù)越多,證明該站點(diǎn)影響越大,質(zhì)量也越高。某一站點(diǎn)被鏈次數(shù)是搜索引擎搜索結(jié)果排序的一項(xiàng)重要指標(biāo)。
網(wǎng)絡(luò)關(guān)鍵信息的篩選與影響力評(píng)估所帶來的益處是顯而易見的,必將對(duì)用戶的實(shí)際需求與科學(xué)研究等方面的發(fā)展起到積極的作用。
參考文獻(xiàn)
[1] 赫建營(yíng),晏海華,金茂忠,等.結(jié)合本體篩選和文本挖掘的垂直搜索引擎研究[J].計(jì)算機(jī)科學(xué),2008,35(2):188-190.
[2] 中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告:第23次.http://www.cnnic.net.cn,2009.1.
[3] 楊海濤.網(wǎng)絡(luò)信息檢索的困境及發(fā)展趨勢(shì)[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2008,18(1):13-14.
[4] 劉雁書,方平.網(wǎng)絡(luò)信息影響力評(píng)價(jià)方法[J].高校圖書館工作,2002,22(88):16-19.
[5] 韋彤.論高校圖書館情報(bào)咨詢部門的新職能-網(wǎng)絡(luò)信息資源搜索評(píng)估與咨詢[J].高校圖書館工作,2002,22(87).