最新設(shè)計(jì)資源

基于預(yù)訓(xùn)練模型的基層治理敏感實(shí)體識別方法[其他][數(shù)據(jù)中心]

基層治理產(chǎn)生的大量敏感數(shù)據(jù)可通過數(shù)據(jù)脫敏去除隱私內(nèi)容,但這些數(shù)據(jù)包含較多非結(jié)構(gòu)化文本數(shù)據(jù),難以直接進(jìn)行數(shù)據(jù)脫敏。因此,需要對非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行命名實(shí)體識別以提取敏感數(shù)據(jù)。首先把敏感實(shí)體分為16類并對信訪文本進(jìn)行標(biāo)注,輸入層表示采用預(yù)訓(xùn)練模型BERT,編碼層利用雙向長短時(shí)記憶網(wǎng)絡(luò)汲取上下文信息,解碼層通過條件隨機(jī)場模型優(yōu)化序列,構(gòu)建了較高精度的基層治理敏感實(shí)體識別模型。針對脫敏工作需要,改變假陰性和假陽性的loss權(quán)重,并采用敏感實(shí)體框選率輔助評價(jià)模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進(jìn)行實(shí)驗(yàn),F(xiàn)1值分別為88.38%和90.11%,相較于基準(zhǔn)模型提升了4.64%和3.78%。該模型可應(yīng)用于非結(jié)構(gòu)化文本的敏感實(shí)體識別,識別成功率高。現(xiàn)有評價(jià)指標(biāo)未能較好地反映敏感實(shí)體的間接推理關(guān)系,應(yīng)當(dāng)探索更完善的敏感實(shí)體評價(jià)體系。

發(fā)表于:2023/9/25

基于遺傳算法的輸變電設(shè)備數(shù)據(jù)補(bǔ)全*[電源技術(shù)][智能電網(wǎng)]

在數(shù)字孿生技術(shù)的發(fā)展下,我國電網(wǎng)行業(yè)也在由原來的物理電網(wǎng)逐步向數(shù)字電網(wǎng)發(fā)展。輸變電設(shè)備作為電網(wǎng)中的電能輸送和傳輸?shù)臉屑~設(shè)備,其運(yùn)行的可靠性直接關(guān)系到電網(wǎng)的安全穩(wěn)定運(yùn)行。因此,及時(shí)掌握輸變電設(shè)備當(dāng)前的運(yùn)行狀態(tài)以及未來一段時(shí)間的運(yùn)行趨勢,實(shí)現(xiàn)對設(shè)備運(yùn)行狀態(tài)的準(zhǔn)確評估,對于保證設(shè)備安全可靠運(yùn)行具有重要意義。然而,在目前的實(shí)際應(yīng)用過程中,受限于傳感裝置穩(wěn)定性差、現(xiàn)場運(yùn)行環(huán)境惡劣、電磁環(huán)境復(fù)雜等原因,輸變電設(shè)備的狀態(tài)量數(shù)據(jù)會出現(xiàn)數(shù)據(jù)缺失造成獲得的數(shù)據(jù)質(zhì)量較差,這會直接影響設(shè)備狀態(tài)評估模型的準(zhǔn)確性。提出一種基于遺傳算法的輸變電設(shè)備缺失數(shù)據(jù)補(bǔ)全方法,首先對變換域隨機(jī)賦值,然后通過實(shí)現(xiàn)稀疏域中系數(shù)向量最小化達(dá)到缺失點(diǎn)恢復(fù)的效果。實(shí)驗(yàn)證明,該算法能夠準(zhǔn)確地恢復(fù)缺失數(shù)據(jù)。

發(fā)表于:2023/9/22