摘 要: 為了減少網(wǎng)絡(luò)中的不良信息對(duì)青少年造成的危害,設(shè)計(jì)了一種臟字過(guò)濾的軟件,可以發(fā)現(xiàn)那些網(wǎng)頁(yè)內(nèi)容中含有的不良信息,便于網(wǎng)絡(luò)管理員對(duì)網(wǎng)絡(luò)文化的維護(hù)。
關(guān)鍵詞: Java;臟字;過(guò)濾器;設(shè)計(jì)
良好的網(wǎng)絡(luò)文化對(duì)培養(yǎng)青少年的愛(ài)國(guó)意識(shí)、創(chuàng)新精神、促進(jìn)青少年良好的個(gè)性發(fā)展以及文化學(xué)習(xí)等方面都有積極的作用。但是網(wǎng)絡(luò)文化中混雜著種種不良因素,對(duì)青少年造成許多負(fù)面影響:網(wǎng)絡(luò)中的不健康內(nèi)容不利于青少年的成長(zhǎng),甚至造成許多青少年犯罪行為的不斷發(fā)生;網(wǎng)絡(luò)世界的虛擬性還會(huì)造成青少年對(duì)現(xiàn)實(shí)社會(huì)的不滿(mǎn),青少年對(duì)網(wǎng)絡(luò)世界的過(guò)分迷戀會(huì)導(dǎo)致網(wǎng)絡(luò)孤獨(dú),網(wǎng)絡(luò)中多元化的內(nèi)容會(huì)導(dǎo)致青少年認(rèn)識(shí)偏差,網(wǎng)絡(luò)的隱匿性容易使青少年道德弱化[1]。特別令人擔(dān)憂的是不良的網(wǎng)絡(luò)文化對(duì)青少年的犯罪起著推動(dòng)作用,值得全社會(huì)關(guān)注和重視。
本文提出了一種臟字過(guò)濾器軟件的設(shè)計(jì),對(duì)網(wǎng)絡(luò)中不良的內(nèi)容進(jìn)行查找、發(fā)現(xiàn),避免這些不良網(wǎng)絡(luò)文化侵蝕青少年的心靈健康。
1 臟字過(guò)濾器的設(shè)計(jì)原理
臟字過(guò)濾器的原理圖如圖1所示。其原理如下:(1)對(duì)臟字庫(kù)的內(nèi)容進(jìn)行分割,把臟字庫(kù)中所有的臟字或詞組分開(kāi),并把這些臟字或詞組存入數(shù)組中;(2)將待測(cè)文件庫(kù)中的文件進(jìn)行逐個(gè)讀取,并記錄文件的內(nèi)容;(3)在待測(cè)文件中查找是否存在剛存放臟字或臟詞組內(nèi)容的數(shù)組里面的內(nèi)容,如果有,進(jìn)行標(biāo)注等操作;如果沒(méi)有,繼續(xù)檢查待測(cè)文件庫(kù)中的下一個(gè)待測(cè)文件,直到待測(cè)文件庫(kù)中的待測(cè)文件都被檢查完為止;(4)輸出結(jié)果。即輸出待測(cè)文件庫(kù)中每個(gè)待測(cè)文件中包含臟字或臟詞組的個(gè)數(shù)及出處等信息。
2 算法實(shí)現(xiàn)
軟件開(kāi)發(fā)環(huán)境:myeclipse平臺(tái),Java語(yǔ)言。首先以myeclipse平臺(tái)新建一個(gè)java project,在新建的project中需要導(dǎo)入下面相關(guān)文件:
import java.io.BufferedReader;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.StringTokenizer;
過(guò)濾器軟件中main函數(shù)的主要內(nèi)容如下:
public static void main(String[] args) {
BufferedReader br=new BufferedReader(new InputStreamReader(System.in));
String ans=null;
int cnt=0;//字庫(kù)中關(guān)鍵詞個(gè)數(shù)
int number=0;//臟字出現(xiàn)次數(shù)
String filepath="D:\\臟字待測(cè)文件庫(kù)";
//待檢測(cè)文件路徑,此文件夾下可以放若干個(gè)待檢測(cè)的文件
String fileLibrarypath="D:\\臟字典\\file.txt";
//臟字庫(kù)文件的存放路徑
File file = new File(filepath);
try {
//讀入用戶(hù)輸入的回車(chē)鍵信息
System.out.println("請(qǐng)按回車(chē)鍵,查看過(guò)濾信息:");
String str = null;
str = br.readLine();
if (str != null) {
if (!file.isDirectory()) {
System.out.println("待檢測(cè)文件路徑
不對(duì),請(qǐng)修改路徑。");
} else if (file.isDirectory()) {
ans=getcontent(fileLibrarypath);
int k;
StringTokenizer sst=new
StringTokenizer(ans, "|");
k = sst.countTokens();
String[] record = new String[k];
while (sst.hasMoreElements()) {
record[cnt] = sst.nextToken();
cnt++;
}
String[] filelist = file.list();
for (int i = 0, flen = filelist.length; i
< flen; i++){
String temp = filepath +
"\\" + filelist[i];
number = searchkeyword(record,
cnt, temp);
System.out.println("第"+(i+1) +"文件中臟字出現(xiàn)的次數(shù):" + number);
//字庫(kù)中關(guān)鍵詞個(gè)數(shù)
}
} else {
//提示用戶(hù)按回車(chē)鍵
System.out.println("你還沒(méi)有輸入回
車(chē)鍵信息");
}
}
} catch (IOException e) {
e.printStackTrace();
}
//輸出查詢(xún)結(jié)果
if (ans != null) {
System.out.println("字庫(kù)中關(guān)鍵詞個(gè)數(shù):"+ cnt);//字庫(kù)中關(guān)鍵詞個(gè)數(shù)
System.out.println("臟字庫(kù)內(nèi)容如下:"+ ans);
} else {
System.out.println("沒(méi)有可以匹配的信息");
//輸出臟字庫(kù)中的內(nèi)容
}
}
//得到指定路徑文件中的內(nèi)容
private static String getcontent(String filepath) {
String all = "";
File file = new File(filepath);
try {
if (!file.isFile()) {
System.out.println("文件路徑不對(duì),請(qǐng)修改路徑");
} else {
File readfile = new File(filepath);
BufferedReader br = new BufferedReader(new FileReader(readfile));
String ss = br.readLine();
while (ss != null) {
all = all + ss;
//all中存放讀取的文件內(nèi)容信息
ss = br.readLine();
}
}
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return all;
}
//在待測(cè)文件中匹配臟字出現(xiàn)的次數(shù)
private static int searchkeyword(String[] str, int cnt, String filepath){
int number = 0;
String s = "";
s = getcontent(filepath);
for (int i = 0; i < cnt; i++) {
if (s.indexOf(str[i]) > -1) {
number++;
}
}
return number;
}
至此,完成了臟字過(guò)濾器軟件代碼的編寫(xiě)工作,接下來(lái)可以進(jìn)行run操作,即可以得到待測(cè)文件庫(kù)中的待測(cè)文件包含臟字次數(shù)及出處等相關(guān)信息的結(jié)果。
3 實(shí)驗(yàn)結(jié)果分析
臟字庫(kù)的存放路徑:D:\臟字典\file.txt;臟字庫(kù)文件中的內(nèi)容略。
待測(cè)文件庫(kù)的存放路徑:D:\臟字待測(cè)文件庫(kù);文件庫(kù)中存放了三個(gè)文件,分別為:test1.txt、test2.txt、test3.txt。
運(yùn)行該過(guò)濾器軟件后,得出的檢測(cè)結(jié)果如圖2所示。
由圖可以看到把待測(cè)文件中臟字及臟詞組出現(xiàn)的次數(shù)全部顯示出來(lái),結(jié)果與實(shí)際情況完全一致。
本文設(shè)計(jì)的臟字過(guò)濾器軟件,已在myeclipse環(huán)境下通過(guò)Java語(yǔ)言實(shí)現(xiàn),并對(duì)整個(gè)過(guò)濾器軟件進(jìn)行了測(cè)試,測(cè)試結(jié)果顯示該設(shè)計(jì)完全可以達(dá)到對(duì)網(wǎng)頁(yè)文件中的臟字進(jìn)行過(guò)濾,還能指出這些臟字的數(shù)目及其出處。為網(wǎng)絡(luò)管理員的管理帶來(lái)方便,并給網(wǎng)絡(luò)管理方面的編程人員提供了一個(gè)良好的開(kāi)發(fā)平臺(tái)。
參考文獻(xiàn)
[1] 周偉文,侯建華.網(wǎng)絡(luò)改變了什么:青少年的網(wǎng)絡(luò)生存[M].石家莊:河北人民出版社,2005:292-294.