摘要:采集稅源數(shù)據(jù),對(duì)加強(qiáng)稅務(wù)監(jiān)控有著重要意義。本文基于稅控收款機(jī)標(biāo)準(zhǔn)GB18240.1~GB18240.6,以使用Linux 操作系統(tǒng)、并口打印機(jī)的電子收款機(jī)為平臺(tái),以采集銷(xiāo)售明細(xì)數(shù)據(jù)并在打印***上增加稅控碼為目的,提出了一種利用內(nèi)核打印驅(qū)動(dòng)模塊修改和netlink socket 技術(shù)實(shí)現(xiàn)的稅源數(shù)據(jù)采集方案。
1. 引言
稅收是國(guó)家財(cái)政的重要組成部分,但是在稅收領(lǐng)域依法納稅意識(shí)淡薄,偷稅逃稅現(xiàn)象依然比較嚴(yán)重,尤其是對(duì)財(cái)務(wù)核算不健全的*,稅務(wù)機(jī)關(guān)難以實(shí)施有效監(jiān)控。這種現(xiàn)狀不但嚴(yán)重?cái)_亂正常的經(jīng)濟(jì)秩序,而且導(dǎo)致國(guó)家稅收大量流失。為了進(jìn)一步加強(qiáng)稅源監(jiān)控,堵塞稅收漏洞,減少稅收流失,國(guó)家先后出臺(tái)了稅控收款機(jī)標(biāo)準(zhǔn)GB18240.1~GB18240.6 等六個(gè)部分,建立了以電子收款機(jī)+稅控器+稅控IC 卡+稅控收款機(jī)管理系統(tǒng)的基本工作模式,明確了以票控稅的基本原則。要求每當(dāng)電子收款機(jī)上完成一筆銷(xiāo)售時(shí),收集其銷(xiāo)售明細(xì)數(shù)據(jù),將其交由稅控器記錄統(tǒng)計(jì),并將稅控器依據(jù)銷(xiāo)售明細(xì)數(shù)據(jù)生成的稅控碼添加到銷(xiāo)售小票上,以此來(lái)表示此筆銷(xiāo)售已被稅務(wù)機(jī)關(guān)記錄。本文所討論的便是一種從電子收款機(jī)采集稅源數(shù)據(jù)即銷(xiāo)售明細(xì)數(shù)據(jù)的解決方案。
因?yàn)殡娮邮湛顧C(jī)使用的操作系統(tǒng)有很多種,對(duì)于不同操作系統(tǒng)采集稅源數(shù)據(jù)的方案都有所不同。本文具體討論Linux 操作系統(tǒng)下使用并口打印機(jī)的電子收款機(jī)的稅源數(shù)據(jù)采集方案,使用串口打印機(jī)的情形亦可參照。Windows 操作系統(tǒng)下的采集方案請(qǐng)查閱參考文獻(xiàn)。
2 方案設(shè)計(jì)
Linux 系統(tǒng)將打印機(jī)設(shè)備視為文件,通過(guò)對(duì)該文件的寫(xiě)操作來(lái)實(shí)現(xiàn)打印功能。通常情況下,對(duì)文件系統(tǒng)的監(jiān)控是通過(guò)系統(tǒng)調(diào)用劫持來(lái)實(shí)現(xiàn)的。但是1) Linux 2.6 版本之后的內(nèi)核,系統(tǒng)調(diào)用表的地址已經(jīng)不能導(dǎo)出,系統(tǒng)調(diào)用劫持的實(shí)現(xiàn)難度加大;2) 劫持 sys_write 系統(tǒng)調(diào)用后,所有的文件寫(xiě)入操作都會(huì)被劫持,對(duì)系統(tǒng)的性能有較大影響;3) 修改后的打印數(shù)據(jù)必須存入銷(xiāo)售軟件進(jìn)程的用戶內(nèi)存空間,才能調(diào)用文件驅(qū)動(dòng)模塊write 函數(shù)將其打印出來(lái)。而侵入銷(xiāo)售軟件進(jìn)程將大大降低系統(tǒng)的獨(dú)立性和可靠性。
基于以上考慮,選擇了通過(guò)修改內(nèi)核打印驅(qū)動(dòng)模塊來(lái)實(shí)現(xiàn)對(duì)電子收款機(jī)上銷(xiāo)售小票打印數(shù)據(jù)的截獲。
然而設(shè)備驅(qū)動(dòng)運(yùn)行于內(nèi)核態(tài),具有很大的局限性,如不能在終端上打印、不能做大延時(shí)的操作、不能使用C 的庫(kù)函數(shù)等等,難以滿足稅源數(shù)據(jù)采集系統(tǒng)的功能需要。所以需要一個(gè)用戶態(tài)的守護(hù)進(jìn)程常駐內(nèi)存,對(duì)內(nèi)核態(tài)采集到的數(shù)據(jù)進(jìn)行處理。
這樣整個(gè)稅源數(shù)據(jù)采集系統(tǒng)可以分為如下兩個(gè)部分:
1)內(nèi)核空間
在 Linux 并口打印驅(qū)動(dòng)模塊中增加一個(gè)攔截函數(shù),替換原有的lp_write 函數(shù),負(fù)責(zé)將打印數(shù)據(jù)發(fā)送給用戶態(tài)的守護(hù)進(jìn)程,并在收到守護(hù)進(jìn)程返回的新的打印數(shù)據(jù)之后,將其打印出來(lái)。
2)用戶空間
實(shí)現(xiàn)一個(gè)常駐內(nèi)存的用戶態(tài)守護(hù)進(jìn)程,負(fù)責(zé)接收內(nèi)核截取到的打印數(shù)據(jù),并在進(jìn)行處理后回送給內(nèi)核。
圖 1 Linux 電子收款機(jī)稅源數(shù)據(jù)采集系統(tǒng)框架圖
3 關(guān)鍵實(shí)現(xiàn)技術(shù)
實(shí)現(xiàn)上述設(shè)計(jì)的關(guān)鍵在于解決“內(nèi)核態(tài)與用戶態(tài)的進(jìn)程間通信”、“攔截并口打印驅(qū)動(dòng)的write 操作”、“打印進(jìn)程的阻塞及喚醒”三個(gè)問(wèn)題。
3.1 內(nèi)核態(tài)與用戶態(tài)的進(jìn)程間通信
本方案這種分為內(nèi)核空間和用戶空間兩部分的結(jié)構(gòu)設(shè)計(jì),首先需要解決的就是內(nèi)核態(tài)與用戶態(tài)的進(jìn)程間通信(interprocess communicatiON, IPC)。而在各種IPC 方法中,最適合此處設(shè)計(jì)需要的就是netlink socket 技術(shù)。
Netlink socket 最早出現(xiàn)于Linux 2.2 版的內(nèi)核中,并在2. 4 版以后的版本中作為主要的內(nèi)核與用戶空間的通信方式而被廣泛使用。相對(duì)于系統(tǒng)調(diào)用、ioctl 以及proc 文件系統(tǒng)等IPC方法而言,它具有簡(jiǎn)單易用、異步通信(適合大數(shù)據(jù)傳輸)、無(wú)編譯依賴(lài)(可模塊實(shí)現(xiàn))、支持多播、支持內(nèi)核發(fā)起會(huì)話等優(yōu)點(diǎn)。其中“異步通信、無(wú)編譯依賴(lài)、支持內(nèi)核發(fā)起會(huì)話”
這三點(diǎn)正是本系統(tǒng)需要的關(guān)鍵特性,也是選用該技術(shù)的最主要原因。
Netlink socket 的通信依據(jù)是一個(gè)對(duì)應(yīng)于進(jìn)程的標(biāo)識(shí),一般定為該進(jìn)程的ID。當(dāng)通信的一端處于中斷過(guò)程時(shí),該標(biāo)識(shí)為0。當(dāng)使用netlink socket 進(jìn)行通信,通信的雙方都是用戶態(tài)進(jìn)程,則使用方法類(lèi)似于消息隊(duì)列。但通信雙方有一端是中斷過(guò)程,使用方法則不同。Netlinksocket 的最大特點(diǎn)是對(duì)中斷過(guò)程的支持,它在內(nèi)核空間接收用戶空間數(shù)據(jù)時(shí)不再需要用戶自行啟動(dòng)一個(gè)內(nèi)核線程,而是通過(guò)另一個(gè)軟中斷調(diào)用用戶事先指定的接收函數(shù),這樣就可以保證數(shù)據(jù)接收的實(shí)時(shí)性。
當(dāng) netlink socket 用于內(nèi)核空間與用戶空間的通信時(shí),在用戶空間的創(chuàng)建方法和一般套接字使用類(lèi)似,但內(nèi)核空間的創(chuàng)建方法則不同。在內(nèi)核模塊中使用 netlink_kernel_create()函數(shù)創(chuàng)建socket 時(shí)需要指明接收函數(shù)。之后用戶空間進(jìn)程創(chuàng)建socket,并將通信標(biāo)識(shí)(一般是該進(jìn)程的ID)發(fā)送到內(nèi)核空間。這樣內(nèi)核空間獲得了用戶空間進(jìn)程的通信標(biāo)識(shí)后就可以進(jìn)行通信了。
3.2 攔截并口打印驅(qū)動(dòng)的write 操作
Linux 操作系統(tǒng)將設(shè)備看作文件,每個(gè)Linux 的設(shè)備驅(qū)動(dòng)程序都定義了一個(gè) file_operation結(jié)構(gòu),結(jié)構(gòu)中的各個(gè)成員是驅(qū)動(dòng)模塊中定義函數(shù)的指針, 通過(guò)這些函數(shù)具體實(shí)現(xiàn)對(duì)文件的open, read, write 等操作。因此,只要將并口打印驅(qū)動(dòng)模塊的file_operation 結(jié)構(gòu)常量——lp_fops的write 成員的值由lp_write 替換為指向攔截函數(shù)的指針就能實(shí)時(shí)地?cái)r截并口打印機(jī)的打印操作。
這里需要實(shí)現(xiàn)兩個(gè)關(guān)鍵函數(shù):
1)lp_write_from_kernellp_write_from_kernel 函數(shù)實(shí)現(xiàn)內(nèi)核空間的緩沖區(qū)數(shù)據(jù)的打印功能。來(lái)自守護(hù)進(jìn)程的修改后打印數(shù)據(jù)是保存在內(nèi)核空間的,因此不能調(diào)用原有的lp_write 函數(shù)進(jìn)行打印。具體的實(shí)現(xiàn)可依照l(shuí)p_write,只要將調(diào)用copy_from_user 函數(shù)的地方改為調(diào)用memcpy 函數(shù)即可。
2)lp_interceptlp_intercept 函數(shù)函數(shù)用于替換lp_write,攔截并口打印驅(qū)動(dòng)的write 操作,實(shí)現(xiàn)打印數(shù)據(jù)截取與修改:當(dāng)電子收款機(jī)的銷(xiāo)售軟件調(diào)用并口打印驅(qū)動(dòng)的write 函數(shù)時(shí),將寫(xiě)緩沖區(qū)的打印數(shù)據(jù)發(fā)送給守護(hù)進(jìn)程;待守護(hù)進(jìn)程返回修改后的打印數(shù)據(jù)(附加了稅控碼),調(diào)用lp_write_from_kernel 將其打印出來(lái)。
3.3 打印進(jìn)程的阻塞及喚醒
當(dāng)收到電子收款機(jī)的銷(xiāo)售軟件向并口打印機(jī)發(fā)出的打印請(qǐng)求時(shí),內(nèi)核態(tài)的并口打印模塊需在將數(shù)據(jù)發(fā)送給用戶態(tài)的守護(hù)進(jìn)程之后阻塞打印請(qǐng)求進(jìn)程。并且,當(dāng)且僅當(dāng)接收到守護(hù)進(jìn)程的返回?cái)?shù)據(jù)時(shí),才會(huì)喚醒打印請(qǐng)求進(jìn)程完成打印。
如何實(shí)現(xiàn)打印進(jìn)程的阻塞及喚醒就是最后一個(gè)關(guān)鍵技術(shù)點(diǎn)。因?yàn)殡娮邮湛顧C(jī)只配備一個(gè)打印機(jī)、不需要復(fù)雜的互斥技術(shù),所以只要使用“簡(jiǎn)單睡眠”就可以達(dá)到這個(gè)目標(biāo)——通過(guò)使用下面的宏或函數(shù):
4 小結(jié)
本文詳細(xì)說(shuō)明了如何修改可加載的內(nèi)核驅(qū)動(dòng)模塊實(shí)現(xiàn)并口打印數(shù)據(jù)的攔截與修改,如何運(yùn)用netlink socket 技術(shù)實(shí)現(xiàn)內(nèi)核與用戶進(jìn)程的通訊,以及進(jìn)程的阻塞及喚醒技術(shù)。并在此基礎(chǔ)上提出了一種利用上述技術(shù)實(shí)現(xiàn)的Linux 電子收款機(jī)稅源數(shù)據(jù)采集方案。此方案在無(wú)需改變電子收款機(jī)原有設(shè)計(jì)架構(gòu)的條件下,實(shí)現(xiàn)了稅源數(shù)據(jù)采集及***稅控碼添加功能,經(jīng)實(shí)際環(huán)境測(cè)試可行,符合對(duì)稅源數(shù)據(jù)采集系統(tǒng)的整體要求。