AET主站

" 人工智能"的相關文章

《電子技術(shù)應用》編輯部 聚合所有相關的文章

摘要:針對稀土專利文本專業(yè)性強的特點以及現(xiàn)有的文本分類方法存在的不足,鑒于類別注意力在計算機視覺領域的廣泛應用和取得的良好效果,提出了一種用于文本分類的類別注意力模塊(Category Attention Module,CAB),并結(jié)合預訓練模型ERNIE和卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)構(gòu)建了一個用于稀土專利文本分類的創(chuàng)新模型ERNIE-CAB-CNN。模型使用ERNIE對專利文本進行向量化,得到語義信息更加豐富的向量表示后,通過CAB為文本中各個類別的重要特征賦予較高權(quán)值,使模型可以更準確地區(qū)分不同類別的特征。最后用CNN進一步提取文本中其他關鍵局部特征,得到的最終文本向量表示用于分類。通過Patsnap專利數(shù)據(jù)庫官方網(wǎng)站檢索下載稀土專利數(shù)據(jù)構(gòu)建數(shù)據(jù)集進行實驗,實驗結(jié)果表明,稀土專利文本分類模型ERNIE-CAB-CNN在測試集上分類的準確率、精確率、F1分數(shù)分別為82.68%、83.2%、82.06%,取得了良好的分類效果。

摘要:現(xiàn)有面向高效輕量化MobileNetV3網(wǎng)絡的加速方法通常采用高度定制的計算引擎進行模型計算,從而限制了加速器的可擴展性使其僅適用于小型網(wǎng)絡或資源豐富的硬件平臺。針對此問題,提出了基于動態(tài)自適應計算引擎的MobileNetV3網(wǎng)絡加速器。首先,設計了局部感知區(qū)域卷積的流水線推理架構(gòu)實現(xiàn)特征、權(quán)重的高度并行處理和緩沖調(diào)度。其次,提出全局自適應的點卷積方法優(yōu)化點卷積,并結(jié)合空間探索獲得最優(yōu)的參數(shù)配置以實現(xiàn)最大計算并行性。此外,加速器可以根據(jù)模型參數(shù)變化動態(tài)配置以適應不同場景。實驗結(jié)果顯示加速器推理速度為8 F/s,是現(xiàn)有方法速度的2.7倍。

摘要:隨著社交網(wǎng)絡的快速發(fā)展,人們在社交網(wǎng)絡中擁有越來越多的虛擬身份,識別同一自然人不同網(wǎng)絡虛擬身份的網(wǎng)絡用戶身份鏈接問題變得越來越重要。用戶身份鏈接有助于挖掘網(wǎng)絡用戶的隱信息,構(gòu)建全面的網(wǎng)絡用戶畫像,進而促進跨網(wǎng)絡的推薦、鏈接預測、信息傳播等多個研究領域發(fā)展?,F(xiàn)有的基于用戶屬性和基于網(wǎng)絡結(jié)構(gòu)的用戶身份鏈接方法,沒有考慮不同用戶之間影響力差異因素,收斂速度較慢?;谏疃扔巫叩挠脩羯矸萱溄臃椒ǎ谌攵囝^注意力機制,對用戶間影響力進行建模,實驗結(jié)果表明,該方法可以很好地改進算法有效性,提高訓練效率。

摘要:為了實現(xiàn)多種水果在采摘后自動化篩選和分揀中腐敗水果識別的問題,提出了改進的YOLOv5n模型,命名為mobile-YOLO。首先將YOLOv5n的主干網(wǎng)絡替換為MobileNetV3并引入深度可分離卷積,相較于原模型,這種改進在計算效率和速度上都有所提升,并且準確率也得到了提高。為了進一步提升速度,將C3模塊替換為C2f模塊,實現(xiàn)輕量化的同時獲得了更豐富的梯度流信息。最后將原有的CIoU替換為α-CIoU,以加快收斂速度并保證圖像框位置的準確性。mobile-YOLO相較于原始的YOLOv5n,mAP@.5(mean Average Precision)達到了98.1%,mAP@.5:.95達到了94.2%,同時在P(Precision)值為97.1%和R(Recall)值為96.8%的情況下,參數(shù)量幾乎與YOLOv5n保持一致。

摘要:由于漢語和越南語之間存在顯著的語法差異及語料稀缺,漢越神經(jīng)機器翻譯任務面臨名詞翻譯不準確的挑戰(zhàn)。提出了一種新穎的多模態(tài)神經(jīng)機器翻譯方法,該方法融合了文本預訓練模型和視覺語言聯(lián)合預訓練模型。通過文本預訓練模型,能夠捕獲深層的語言結(jié)構(gòu)和語義;而視覺語言聯(lián)合訓練模型則提供了與文本相關聯(lián)的視覺上下文,這有助于模型更準確地理解和翻譯名詞。兩種模型通過一個簡潔高效的映射網(wǎng)絡結(jié)合,并通過Gumbel門控模塊動態(tài)地整合多模態(tài)信息,以優(yōu)化翻譯輸出。在漢越及越漢翻譯任務中,該方法相比傳統(tǒng)Transformer模型分別提升了7.13和4.27的BLEU值。

摘要:近期,人臉識別技術(shù)在社會上廣受關注,其非接觸式的識別特性相較于指紋等傳統(tǒng)接觸式識別方法展現(xiàn)出明顯優(yōu)勢。在深度學習領域,由于傳統(tǒng)卷積神經(jīng)網(wǎng)絡在人臉識別任務上的準確性和速度尚有提升空間,因此提出采用改進的AlexNet卷積神經(jīng)網(wǎng)絡進行人臉識別。通過實驗驗證,與傳統(tǒng)卷積網(wǎng)絡相比,改進后的AlexNet在人臉識別上不僅準確度更高,而且識別過程更為穩(wěn)定。

摘要:目前,可再生能源大量接入配電網(wǎng),但是太陽能、風能、光伏及風電等可再生能源的間歇性和隨機性不可避免地會造成配電網(wǎng)的波動??紤]電網(wǎng)內(nèi)可再生能源發(fā)電功率與用電負荷隨時間變化的特點,提出一種基于小波變換和神經(jīng)網(wǎng)絡的可再生能源接入配電網(wǎng)的負荷預測和優(yōu)化方法。首先采集配電網(wǎng)的發(fā)電與負荷數(shù)據(jù),利用小波變換處理收集到的數(shù)據(jù),得到局部尺度和頻率分解的特征參數(shù),建立神經(jīng)網(wǎng)絡預測模型;然后,對經(jīng)過小波變換后得到的特征參數(shù)進行訓練,根據(jù)預測負荷對可再生能源的發(fā)電量進行調(diào)節(jié),保持配電網(wǎng)供需側(cè)的動態(tài)平衡。結(jié)果表明,所提方法能夠?qū)ω摵蛇M行有效預測,通過提前預測負荷量,保證配電網(wǎng)用電穩(wěn)定性的同時,最大化利用可再生能源。

摘要:目前的人工視覺系統(tǒng)仍然無法處理一些涉及高速運動場景和高動態(tài)范圍的真實世界場景。事件相機因其低延遲和高動態(tài)范圍捕捉高速運動的優(yōu)勢具有消除上述問題的能力。然而,由于事件數(shù)據(jù)的高度稀疏和變化性質(zhì),在保證其快速性的同時將事件重建為視頻仍然具有挑戰(zhàn)性。因此提出了一種基于Transformer殘差網(wǎng)絡和光流估計的事件流重建算法,通過光流估計和事件重建的聯(lián)合訓練,實現(xiàn)自監(jiān)督的重建過程,并引入去模糊預處理和亞像素上采樣模塊來提高重建質(zhì)量。實驗結(jié)果表明,在公開數(shù)據(jù)集上,提出的方法可以有效提高事件流的重建效果。

摘要:miRNA的突變和異常表達可能導致各種疾病,因此預測miRNA與疾病的潛在相關性對于臨床醫(yī)學和藥物研究的發(fā)展具有重要意義。拓撲結(jié)構(gòu)是miRNA-疾病預測算法的重要組成部分,然而當前算法并未有效利用拓撲結(jié)構(gòu)導致預測結(jié)果并不理想。與此同時,如何有效地融合多源數(shù)據(jù)也是當前的研究趨勢。針對上述問題,提出一種自適應融合異質(zhì)節(jié)點結(jié)構(gòu)信息算法(MMTP),通過利用節(jié)點的一階鄰居和元路徑誘導網(wǎng)絡學習結(jié)構(gòu)特征,并利用度量學習和拓撲傳播自適應地融合異質(zhì)節(jié)點結(jié)構(gòu)信息,以提升miRNA-疾病預測精度。5折交叉驗證實驗結(jié)果表明,MMTP在HMDD v3.2數(shù)據(jù)集上的受試者操作曲線下面積(AUC)為94.81,高于其他模型。并且在基于腎癌的案例研究中,該模型所預測的前30個miRNAs全部得到證實。上述研究證明,所提的MMTP模型可有效預測miRNA-疾病相關性。

摘要:全球老齡化時代的到來引發(fā)的老年人健康監(jiān)護問題不可忽視,而室內(nèi)跌倒對獨居的老年人有非常大的安全隱患。因此,為準確檢測到跌倒動作,使用毫米波雷達三維點云信息進行室內(nèi)跌倒檢測,并提出一種基于外部注意力機制的PointLSTM網(wǎng)絡實現(xiàn)三維點云在時序的分類。通過MIMO體制的毫米波雷達芯片采集人體動作的回波信號,利用集成雷達基帶處理器的微控制器實現(xiàn)信號處理的部分,可將原始數(shù)據(jù)實時轉(zhuǎn)換成三維點云,并提高點云處理中的計算速度及雷達硬件的整體性能?;谕獠孔⒁饬C制的PointLSTM網(wǎng)絡可實現(xiàn)點云在時空中的提取特征和分類識別,網(wǎng)絡改進了PointLSTM幀間點信息的流失問題,并在信息提取中對所有數(shù)據(jù)實現(xiàn)特征聯(lián)系,外部注意力機制通過獨立的可學習參數(shù)優(yōu)化了網(wǎng)絡復雜度和識別精確率。實驗結(jié)果表明,所提出的方法在室內(nèi)環(huán)境下檢測準確率可以達到98.3%,可以有效區(qū)分動作的類別,并驗證了使用毫米波雷達三維點云檢測人體跌倒的可行性。

摘要:構(gòu)建基于云計算的蛋白質(zhì)折疊空間結(jié)構(gòu)預測框架,通過數(shù)據(jù)云存儲設備獲取蛋白質(zhì)序列原始數(shù)據(jù),采用HDFS(Hadoop Distributed File System)分布式存儲方式保存于云端。資源和隊列管理器RQM(Resource Queue Management)開啟云端虛擬機后,以之作為掃描節(jié)點(Sensor Node, SN),SN基于二維AB非格點模型建立最小蛋白質(zhì)分子能量優(yōu)化函數(shù),采用局部搜索機制改進的量子遺傳算法對其作優(yōu)化求解。利用云端GPU設備處理模型訓練數(shù)據(jù),即可實現(xiàn)蛋白質(zhì)折疊空間結(jié)構(gòu)的自動化預測。實驗結(jié)果表明:蛋白質(zhì)序列能量勢函數(shù)計算結(jié)果更小、執(zhí)行效率更高、GDT-TS(Geothermal Development and Testing Tool Suite)評價指標值更大。

摘要:喬木在維持生態(tài)平衡、保護生物多樣性以及調(diào)節(jié)氣候和改善空氣質(zhì)量等方面發(fā)揮著至關重要的作用。針對復雜背景下喬木識別準確率較低的問題,提出了一種基于樹木多特征融合和知識蒸餾的亞熱帶常見喬木識別模型MFFMN-KD-TA。該模型采用3個并行的MobileNetV3_Small主干網(wǎng)絡分別提取樹葉、樹干和樹木整體特征;并通過知識蒸餾和嵌入Triplet Attention模塊的方法優(yōu)化訓練。試驗結(jié)果表明,MFFMN-KD-TA模型在自建樹木測試集上的準確率、精確率和F1分數(shù)分別為0.960 9、0.962 1和0.960 8,較MFFMN模型分別提升了3.05%、2.83%和3.07%。與三分支融合模型3-ShuffleNetV2和3-MobileNetV2相比,提出的多特征融合模型MFFMN-KD-TA參數(shù)量較小且能夠較準確地識別喬木種類,為亞熱帶和其他地區(qū)的樹種識別提供了新思路和新方法。

摘要:通過主動學習模型來選取最有價值的數(shù)據(jù)點進行標注是深度學習減少標注數(shù)據(jù)量的一種方式。預測損失模型是一類與任務無關的主動學習模型,該類模型在多個任務中都有不錯的表現(xiàn)。但是這類模型均不是端到端的模型,不斷變化的輸入特征會導致?lián)p失預測網(wǎng)絡在訓練時出現(xiàn)輸入偏差。提出了時序特征融合預測損失模型用于解決該模型的輸入偏差問題。實驗證明,提出的算法在各個任務中的性能與以往最先進的算法相比,平均提升約1.5%,與原預測損失模型相比,平均提升5%。

摘要:針對當前心音信號識別算法檢測精度不佳問題,提出了一種混合卷積神經(jīng)網(wǎng)絡-支持向量機模型 (CNN-SVM) 的心音信號分類方法。通過PASCAL挑戰(zhàn)實驗數(shù)據(jù),整理出正常與不正常兩類心音信號數(shù)據(jù)庫,通過預處理濾波及MFCC、一二階差分特征提取、PCA降維,輸入CNN-SVM模型進行訓練。并從準確率、召回率、特異性、精確率和F分數(shù)5個方面進行性能評估。為了驗證此算法的有效性,將混合CNN-SVM模型與單一SVM、CNN模型分別進行了對比。實驗結(jié)果表明,該方法能夠以較高識別率將兩種心音信號區(qū)分開,其平均識別準確率接近于99%,相較于單一CNN方法提高了2.48%,同樣高于單一SVM算法。

摘要:預測植物中的蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)具有重要的生物學意義。同時采用了4種編碼方法及深度神經(jīng)網(wǎng)絡構(gòu)建了蛋白質(zhì)相互作用預測模型。結(jié)果表明,提出的融合蛋白質(zhì)語言模型Ankh與深度神經(jīng)網(wǎng)絡的方法構(gòu)建的PPI預測模型性能在3種植物數(shù)據(jù)集上均獲得了最優(yōu)的AUPR和AUC值,Sen及MCC值也均優(yōu)于其他4種蛋白質(zhì)相互作用預測模型。當模型在水稻、大豆的植物PPI數(shù)據(jù)集上進行測試時,所提出的模型AUPR值分別為0.802 5、0.730 1,AUC值分別為0.956 2、0.950 7。這些優(yōu)異的結(jié)果表明,融合蛋白質(zhì)語言模型Ankh的PPI模型可以作為植物蛋白質(zhì)相互作用預測的一個有前途的工具。

摘要:針對主動毫米波圖像中目標與背景紋理區(qū)分度較低導致隱匿目標漏檢問題,并根據(jù)安檢實時性要求,提出一種基于全局通道注意力增強的主動毫米波圖像目標檢測方法。該方法以YOLOv5s為載體,在坐標注意力位置方向上引入全局通道注意模塊,增強對隱匿目標全局通道信息的關注,從而提升在隱匿目標與背景紋理區(qū)分度較低時的檢測能力;再利用K-means++聚類算法重新生成適合毫米波圖像目標檢測的錨框。實驗結(jié)果表明,無論是陣列圖像數(shù)據(jù)集還是線掃圖像數(shù)據(jù)集,該方法增強了對隱匿目標的特征注意,提高了召回率,在滿足安檢實時性的前提下,提升了檢測性能。通過增加少量參數(shù),在陣列圖像數(shù)據(jù)集上,精度、召回率和mAP@.5達到了92.0%、90.93%和95.32%;在線掃圖像數(shù)據(jù)集上,精度、召回率和mAP@.5達到了94.65%、92.67%和97.73%。平均單張圖像推理時間在兩個數(shù)據(jù)集上均達到1 ms,滿足實時性要求。

摘要:開展了一種基于貝塞爾曲線的智能汽車避障局部軌跡規(guī)劃,即路徑規(guī)劃和速度規(guī)劃方法研究。路徑規(guī)劃時,為了適應各種形狀道路,將道路笛卡爾坐標轉(zhuǎn)換為Frénet坐標,以路徑的長度、曲率和連續(xù)性,以及車輛碰撞風險為代價函數(shù),其中引入危險勢場理論,描述車輛碰撞風險,并采用序列二次規(guī)劃方法來求解路徑規(guī)劃這一非線性優(yōu)化問題;速度規(guī)劃時,以行車效率和舒適性為目標,實現(xiàn)速度規(guī)劃,該方法可以通過調(diào)整各子目標函數(shù)的權(quán)重來滿足不同駕駛需求。為了驗證基于貝塞爾曲線軌跡規(guī)劃算法的有效性,設計了直道和彎道上靜態(tài)和動態(tài)避障場景的仿真實驗,結(jié)果表明,提出的軌跡規(guī)劃方法能夠在各種形狀道路上完成避障任務,且避障過程中車輛狀態(tài)變化平穩(wěn),能夠保證乘坐舒適性。

摘要:中文命名實體識別主要包括中文平面命名實體識別和中文嵌套命名實體識別兩個任務,其中中文嵌套命名實體識別任務難度更大。提出了一個基于詞匯增強和表格填充的統(tǒng)一模型TLEXNER,該模型能夠同時處理上述任務。該模型首先針對中文語料分詞困難的問題,使用詞典適配器將詞匯信息融合到BERT預訓練模型,并且將字符與詞匯組的相對位置信息集成到BERT的嵌入層中;然后通過條件層歸一化和雙仿射模型構(gòu)造并預測字符對表格,使用表格建模字符與字符之間的關系,得到平面實體與嵌套實體的統(tǒng)一表示;最后根據(jù)字符對表格上三角區(qū)域的數(shù)值判斷實體類別。提出的模型在平面實體的公開數(shù)據(jù)集Resume和自行標注的軍事領域嵌套實體數(shù)據(jù)集上F1分別是97.35%和91.96%,證明了TLEXNER模型的有效性。

摘要:任務型問答系統(tǒng)一旦構(gòu)建好,通常是固定不變的,能回答的問題非常有限,難以滿足用戶的需求。對此,提出一種自動實時更新知識庫的方法,當用戶提了一個問答系統(tǒng)回答不了的問題,系統(tǒng)會把該問題自動發(fā)送給人工客服,人工客服利用專業(yè)知識回復后,系統(tǒng)能夠自動實時獲取用戶提的問題和人工客服回復的答案,并把這個問答對自動實時更新到知識庫,之后如果其他用戶提了類似的問題,問答系統(tǒng)就能夠快速給出對應的答案。以政務領域的問答系統(tǒng)為例,應用文本向量化方法ERNIE構(gòu)建知識庫自動實時更新的問答系統(tǒng)。經(jīng)過計算機實驗證明,提出的方法能夠?qū)崿F(xiàn)知識庫自動實時更新,構(gòu)建的問答系統(tǒng)具有自主學習與記憶功能,提高了任務型問答系統(tǒng)的智能化水平。

摘要:垃圾分類是建設生態(tài)文明的重要一環(huán),為解決重量級模型難以部署移動端設備的問題,提出基于YOLOv5網(wǎng)絡改進的垃圾圖像分類方法。采用融合GhostNet的主干網(wǎng)絡,用線性運算代替?zhèn)鹘y(tǒng)卷積運算,降低了模型的參數(shù)量,提高了模型推理速度;通過在網(wǎng)絡中加入改進版通道注意力模塊,強化重要的通道特征,獲取更多深層次的特征信息;采用加權(quán)邊界融合方法,提升檢測框的定位精度。經(jīng)實驗證明,該方法在自制數(shù)據(jù)集中較原模型的精度提高了8.5%,參數(shù)量減少了46.7%,平均推理速度提高了1.22 ms,實現(xiàn)了精度和推理速度的綜合提升。

摘要:針對中文事件抽取中語義表征不充分、特征提取不全面等問題,提出一種基于RoBERTa和多層次特征的中文事件抽取方法。通過RoBERTa預訓練模型構(gòu)建字向量,并基于詞性標注和觸發(fā)詞語義信息融入進行字向量擴展;其次使用雙向長短時記憶網(wǎng)絡和卷積神經(jīng)網(wǎng)絡抽取全局特征和局部特征,并通過自注意力機制捕捉不同特征之間的關聯(lián),加強對重要特征的利用;最后通過條件隨機場實現(xiàn)BIO序列標注,完成事件抽取。在DuEE1.0數(shù)據(jù)集上,觸發(fā)詞抽取和事件論元抽取的F1值達到86.9%和68.0%,優(yōu)于現(xiàn)有常用事件抽取模型,驗證了該方法的有效性。

摘要:針對簡單文本分類模型精度不高,預訓練模型結(jié)構(gòu)復雜,在實際環(huán)境中難以直接使用的問題,提出多教師知識蒸餾的文本分類方法。該模型使用“教師-學生網(wǎng)絡”的訓練方法,教師模型為BERT-wwm-ext和XLNet預訓練模型,將兩個模型輸出的概率矩陣通過權(quán)重系數(shù)融合為軟標簽。學生模型為BiGRU-CNN網(wǎng)絡,使用均方差函數(shù)計算軟標簽誤差,使用交叉熵損失函數(shù)計算硬標簽誤差,通過硬標簽和軟標簽訓練學生模型使損失函數(shù)值達到最小。實驗結(jié)果表明,提出的方法精度較學生模型有較大的改進,接近預訓練模型,在保證分類精度的前提下減少了運行時間,提高了效率。

摘要:輸電巡檢圖像的背景復雜,目標檢測易受干擾,基于YOLOX神經(jīng)網(wǎng)絡模型,提出一種輸電線路山火檢測方法。首先采用YOLOX的主干特征提取網(wǎng)絡框架,并將其中多尺度特征提取模塊的常規(guī)卷積替換為可變形卷積;其次在加強特征提取階段增加了通道注意力和空間注意力模塊的融合,能夠自適應火焰的外形多變特點,更加有效地提取到山火特征,從而提高目標檢測的準確率。經(jīng)實驗驗證,所提方法能夠較為準確地檢測到山火,滿足日常巡檢的需求。

摘要:人體關鍵點檢測在智能視頻監(jiān)控、人機交互等領域有重要應用。針對基于熱圖的人體關鍵點檢測算法依賴高分辨率熱圖、計算資源消耗大的問題,提出一種結(jié)合不確定性估計的輕量級算法。使用低分辨率熱圖,結(jié)合不確定性估計預測誤差分布的尺度參數(shù),提高了預測結(jié)果的可信度;利用尺度參數(shù)監(jiān)督和約束熱圖,緩解梯度消失,增強了網(wǎng)絡的魯棒性。COCO數(shù)據(jù)集上實驗結(jié)果表明,與積分姿態(tài)回歸算法相比,改進后算法的平均精度提高了3.3%,降低了資源占用。

摘要:近年來,隨著深度學習技術(shù)的發(fā)展,基于編解碼的圖像分割方法在病理圖像自動化分析上的研究與應用也逐漸廣泛,但由于胃癌病灶復雜多變、尺度變化大,加上數(shù)字化染色圖像時易導致的邊界模糊,目前僅從單一尺度設計的分割算法往往無法獲得更精準的病灶邊界。為優(yōu)化胃癌病灶圖像分割準確度,基于編解碼網(wǎng)絡結(jié)構(gòu),提出一種基于多尺度注意力融合網(wǎng)絡的胃癌病灶圖像分割算法。編碼結(jié)構(gòu)以EfficientNet作為特征提取器,在解碼器中通過對多路徑不同層級的特征進行提取和融合,實現(xiàn)了網(wǎng)絡的深監(jiān)督,在輸出時采用空間和通道注意力對多尺度的特征圖進行注意力篩選,同時在訓練過程中應用綜合損失函數(shù)來優(yōu)化模型。實驗結(jié)果表明,該方法在SEED數(shù)據(jù)集上Dice系數(shù)得分達到0.806 9,相比FCN和UNet系列網(wǎng)絡一定程度上實現(xiàn)了更精細化的胃癌病灶分割。

摘要:面向法律領域的神經(jīng)機器翻譯對于合同文本翻譯等應用場景具有重要價值。由于法律領域雙語對齊語料稀缺,翻譯效果還不理想。針對該問題,目前有效的方法是融入翻譯記憶或翻譯模版等外部信息,但法律領域的文本多具有固定的表達結(jié)構(gòu)且用詞準確規(guī)范,在翻譯記憶庫中同時利用翻譯結(jié)構(gòu)信息和語義信息能夠進一步提升法律領域翻譯性能。基于此,提出一種融入翻譯記憶庫的法律領域機器翻譯方法。提出了一種新的法律領域翻譯記憶庫,首先基于語義和結(jié)構(gòu)信息的相似性訓練跨語言檢索模型以充分利用單語數(shù)據(jù),然后從翻譯記憶庫中檢索與輸入源句相關的一組翻譯記憶和翻譯模版,進而引導翻譯模型生成目標句子。實驗表明,在MHLAW數(shù)據(jù)集上,提出的方法可以使譯文較基線模型提升1.28個BLEU點。

摘要:隨著電力用戶信息采集系統(tǒng)的發(fā)展,更豐富的用戶用電信息被用于用戶用電信息異常的識別?;贔DI攻擊進行虛假數(shù)據(jù)注入,構(gòu)造用戶用電信息異常數(shù)據(jù)集,并提出了一種基于召回率的改進Stacking集成分類算法。該算法采用K-近鄰算法(k-Nearest Neighbors,KNN)、隨機森林模型(Random Forests,RF)、支持向量機(Support Vector Machine,SVM)以及梯度決策樹(Gradient Boosting Decision Tree,GBDT)作為Stacking結(jié)構(gòu)的基分類模型;采用邏輯回歸(Logistic Regression,LR)作為Stacking結(jié)構(gòu)的元分類模型。并基于召回率為基分類模型的輸出結(jié)果進行權(quán)值賦值,從而作為元分類模型的輸入數(shù)據(jù)集。通過實驗驗證,所提的基于召回率的改進Stacking集成分類算法相比于傳統(tǒng)Stacking集成分類算法擁有更高效的分類性能。

摘要:為了能將龐大的深度學習模型壓縮后部署到算力和存儲能力有限的設備中時盡可能減小精度損失,對知識蒸餾模型壓縮方法進行研究,提出了一種改進后帶篩選的多教師模型知識蒸餾壓縮算法。利用多教師模型的集成優(yōu)勢,以各教師模型的預測交叉熵為篩選的量化標準篩選出表現(xiàn)更好的教師模型對學生進行指導,并讓學生模型從教師模型的特征層開始提取信息,同時讓表現(xiàn)更好的教師模型在指導中更具有話語權(quán)。在CIFAR100數(shù)據(jù)集上的VGG13等分類模型實驗結(jié)果表明,與其他壓縮算法相比在最終得到的學生模型大小相同的情況下,精度上有著更好的表現(xiàn)。

摘要:LiDAR技術(shù)的發(fā)展為自動駕駛提供了豐富的3D數(shù)據(jù)。然而,由于遮擋和某些反射材料的原因引起信號丟失,LiDAR點云實際上是不完整的2.5D數(shù)據(jù),這對 3D 感知提出了根本性挑戰(zhàn)。針對這一問題,提出對原始數(shù)據(jù)進行三維補全的方法。根據(jù)大多數(shù)物體形狀對稱且重復率高的特點,通過學習先驗對象形狀的方法估計點云中遮擋部分的完整形狀。該方法首先識別被遮擋和信號缺失影響的區(qū)域,在這些區(qū)域中預測區(qū)域所包含對象形狀的占用概率。針對物體間遮擋的情況,通過形狀的占用概率和共享同類形狀形態(tài)進行三維補全。對自身遮擋的物體,通過自身鏡像進行恢復。最后通過點云目標檢測網(wǎng)絡進行學習。結(jié)果表明,通過該方法能有效地提高生成點云3D邊框的mAP(mean Average Precision)。

摘要:針對在單視圖的乳腺腫塊檢測算法中漏檢率和假陽性率較高的問題,提出了一種改進的自動檢測算法。將擴張殘留網(wǎng)絡(Dilated Residual Network,DRN)結(jié)合重新設計的特征金字塔網(wǎng)絡(Feature Pyramid Network,F(xiàn)PN)用于對乳腺腫塊的檢測。首先利用DRN中的膨脹卷積,減少對圖像的下采樣次數(shù);再擴充網(wǎng)絡的深度,使其輸出滿足FPN所需的輸入;在FPN結(jié)構(gòu)中,采用注意力機制降低不同特征圖直接融合所造成的信息損失,同時采用密集連接代替原有的橫向連接,充分融合淺層特征中目標的位置和細節(jié)信息。仿真實驗顯示,所設計的模型在CBSI-DDSM數(shù)據(jù)集上的檢測精度相比于基準模型提升了7.1%。

摘要:針對化工過程中廣泛應用的連續(xù)攪拌反應釜(CSTR)反應器,提出一種新的基于極限學習機的Hammerstein-Wiener模型的辨識建模方法。其中,Hammerstein-Wiener模型的兩個非線性環(huán)節(jié)采用兩個不同的極限學習機逼近,線性環(huán)節(jié)采用自回歸ARX模型。因極限學習機的特殊結(jié)構(gòu),此模型可以表示成線性回歸的形式,最終利用廣義最小二乘法求解模型的參數(shù)。此方法辨識過程簡單,辨識過程的計算量較小。最后對CSTR的辨識結(jié)果表明,在相同條件下與基于多項式的Hammerstein 模型和ARX-LSSVM Hammerstein 模型相比,該方法具有較高辨識精度,表明了該方法的有效性。

摘要:為了解決城市中共享單車亂停亂放的問題,提出了一種基于OpenMV的共享單車規(guī)范停車系統(tǒng)。系統(tǒng)主要由OpenMV開發(fā)板、BC20通信定位模塊以及OneNET云服務器等組成。其中OpenMV完成對停車狀態(tài)的檢測與識別,借助BC20內(nèi)置的網(wǎng)絡模塊與OneNET云服務器進行數(shù)據(jù)交互,并將檢測結(jié)果反饋至小程序客戶端,從而實現(xiàn)對共享單車的停車檢測和控制。系統(tǒng)通過大量的測試,實驗結(jié)果表明系統(tǒng)運行穩(wěn)定,識別準確率為94.1%,可以實現(xiàn)共享單車的規(guī)范停車自動檢測,具有良好的市場應用前景與價值。

摘要:為解決垃圾網(wǎng)頁檢測中特征提取難度高、計算量大的問題,提出一種僅基于當前網(wǎng)頁的HTML腳本提取語義特征的方法。首先使用深度優(yōu)先搜索和動態(tài)規(guī)劃相結(jié)合的記憶化搜索算法對域名進行單詞切割,采用隱含狄利克雷分布提取主題詞,基于Word2Vec詞向量和詞移距離計算3個單頁語義相似度特征;然后將單頁語義相似度特征融合單頁統(tǒng)計特征,使用隨機森林等分類算法構(gòu)建分類模型進行垃圾網(wǎng)頁檢測。實驗結(jié)果表明,基于單頁內(nèi)容提取語義特征融合單頁統(tǒng)計特征進行分類的AUC值達到88.0%,比對照方法提高4%左右。

摘要:大多數(shù)傳統(tǒng)的深度學習點云補全學習方法僅僅使用了全局特征而忽略了局部特征,為了更好地提取和使用點云的局部特征,提出了一個基于深度學習的端到端點云補全網(wǎng)絡。在點云補全網(wǎng)絡(PCN)的基礎上,編碼部分引入針對局部特征改進的動態(tài)圖卷積(DGCNN),使用多個不同維度的邊卷積提取較為豐富的局部特征,并按照距離弱化遠點的特征;然后用深度殘差網(wǎng)絡連接的思想優(yōu)化網(wǎng)絡結(jié)構(gòu)以實現(xiàn)多尺度特征的融合,并加入平均池化彌補全局池化造成的信息損失;在解碼部分引入折疊網(wǎng)絡(FoldingNet),使輸出的點云更加完整。實驗結(jié)果表明,該點云補全網(wǎng)絡相對PCN等點云補全網(wǎng)絡有部分提升,驗證了新方法的有效性。

摘要:醫(yī)療文本的特征提取及分析在建設臨床決策支持系統(tǒng)方面具有較大的實用價值。針對包含各種術(shù)語和縮寫的原始醫(yī)療文本難以提取特征的情況,提出了一種基于BERT與Word2vec的醫(yī)療文本分析模型。該模型對醫(yī)療病歷中關鍵醫(yī)療實體進行識別,基于知識建立權(quán)重評分機制,對醫(yī)學文本進行語義分析。實驗數(shù)據(jù)表明,模型在醫(yī)療文本特征提取方面具有一定優(yōu)勢,對高血壓性腦出血病歷的分析診斷性能良好,能有效應用于臨床決策支持系統(tǒng)。

摘要:場景圖生成(SGG)任務旨在檢測圖像中的視覺關系三元組,即主語、謂語、賓語,為場景理解提供結(jié)構(gòu)視覺布局。然而,現(xiàn)有的場景圖生成方法忽略了預測的謂詞頻率高但卻無信息性的問題,從而阻礙了該領域進步。為了解決上述問題,提出一種基于增強語義信息理解的場景圖生成算法。整個模型由特征提取模塊、圖像裁剪模塊、語義轉(zhuǎn)化模塊、拓展信息謂詞模塊四部分組成。特征提取模塊和圖像裁剪模塊負責提取視覺特征并使其具有全局性和多樣性。語義轉(zhuǎn)化模塊負責將謂詞之間的語義關系從常見的預測中恢復信息預測。拓展信息謂詞模塊負責擴展信息謂詞的采樣空間。在數(shù)據(jù)集VG和VG-MSDN上與其他方法進行比較,平均召回率分別達到59.5%和40.9%。該算法可改善預測出來的謂詞信息性不足問題,進而提升場景圖生成算法的性能。

摘要:為解決新疆兵團農(nóng)業(yè)現(xiàn)代化建設中有感知無決策的問題,提出一種基于注意力機制模塊(SENet)與卷積神經(jīng)網(wǎng)絡混合模型遷移學習的圖像分類方法(TL-DA-SE-CNN)。該方法選擇4種不同的CNN模型進行權(quán)重采集,包括VGGNet、ResNet、InceptionNet和MobileNet。模型使用SENet分類器代替卷積神經(jīng)網(wǎng)絡的全連接層,提取圖像的結(jié)構(gòu)性高階統(tǒng)計特征進行主題分類,并使用BP算法進行參數(shù)調(diào)整,分類準確度達98.20%。實驗結(jié)果表明,將CNN與遷移學習、數(shù)據(jù)增強和SENet相結(jié)合的技術(shù)提高了牲畜圖像分類的性能,是卷積神經(jīng)網(wǎng)絡在農(nóng)場自動化分群中的有效應用。

摘要:以降低出租車運營損失為目標,分別利用排隊論對司機等待的平均時間成本進行量化,以及通過熵值法改進的TOPSIS模型對不同時段載客可能性進行量化,進而完成空載潛在損失參數(shù)的量化,通過量化指標構(gòu)建出出租車運營損失模型,并基于此模型給出了降低損失的運營決策方法。引用洛陽北郊機場航班及出租車數(shù)據(jù)的驗證,證明了該決策方法能夠有效降低出租車的運營損失。

摘要:隨著目前目標檢測任務輸入圖像分辨率的不斷增大,在特征提取網(wǎng)絡的感受野不變的情況下,網(wǎng)絡提取的特征信息會越來越局限,相鄰特征點之間的信息重合度也會越來越高。提出一種FSA(Fusion Self-Attention)-FPN,設計SAU(Self-Attention Upsample)模塊,SAU內(nèi)部結(jié)構(gòu)通過CNN與自注意力機制(Self-Attention)進行交叉計算以進一步進行特征融合,并通過重構(gòu)FCU(Feature Coupling Unit)消除二者之間的特征錯位,彌補語義差距。以YOLOX-Darknet53為主干網(wǎng)絡,在Pascal VOC2007數(shù)據(jù)集上進行了對比實驗。實驗結(jié)果表明,對比原網(wǎng)絡的FPN,替換FSA-FPN后的平均精度值mAP@[.5:.95]提升了1.5%,預測框的位置也更為精準,在需要更高精度的檢測場景下有更為出色的使用價值。

摘要:針對變壓器結(jié)構(gòu)復雜、維護成本高等特點,提出一種基于深度學習的變壓器故障信號識別算法。首先分析變壓器工作狀態(tài)下的聲紋信號并進行二維圖像信號的轉(zhuǎn)換,利用VGG16神經(jīng)網(wǎng)絡在圖像中的優(yōu)勢,并在此基礎上提出一種MCA注意力機制,該注意力機制能夠同時保留背景信息和細節(jié)信息;其次對VGG16中的最大池化下采樣進行優(yōu)化,采用一種軟池化的采樣方法,減少圖像中最大池化下采樣帶來的特征損失;最后為避免過擬合現(xiàn)象的發(fā)生,將VGG16頂層結(jié)構(gòu)中的激活函數(shù)進行優(yōu)化,引用可以自歸一化的SELU激活函數(shù)。實驗證明,廣義S變換是將一維時域信號轉(zhuǎn)換為二維圖像信號的最佳選擇,所提算法對于6類故障信號的平均識別率達到99.15%。

摘要:深度神經(jīng)網(wǎng)絡在高維數(shù)據(jù)的分類和預測中取得了巨大成功。訓練深度神經(jīng)網(wǎng)絡是數(shù)據(jù)密集型的任務,需從多個數(shù)據(jù)源收集大規(guī)模的數(shù)據(jù)。這些數(shù)據(jù)中通常包含敏感信息時,使得深度神經(jīng)網(wǎng)絡的訓練過程容易泄露數(shù)據(jù)隱私。針對訓練過程中的數(shù)據(jù)隱私和通信代價問題,提出了一種深度神經(jīng)網(wǎng)絡的分布式訓練方法,允許基于多個數(shù)據(jù)源共同訓練深度神經(jīng)網(wǎng)絡。首先,提出了分布式訓練架構(gòu),由1個計算中心和多個代理組成。其次,提出了基于多代理的分布式訓練算法,允許代理在數(shù)據(jù)不出本地和減少通信代價的情況下,通過切割深度神經(jīng)網(wǎng)絡,實現(xiàn)分布式地共同訓練模型。然后,分析了算法的正確性。最后,實驗結(jié)果表明該方法是有效的。

摘要:為提升普鐵接觸網(wǎng)檢修作業(yè)時的安全性以及傳輸信息的抗干擾性,設計了一套基于人工智能機器人技術(shù)加LoRa通信技術(shù)的普鐵接觸網(wǎng)狀態(tài)監(jiān)測系統(tǒng)。該系統(tǒng)主要由在作業(yè)現(xiàn)場內(nèi)具有驗電、掛接地線與回流線功能的機器人作為數(shù)據(jù)采集裝置和作業(yè)現(xiàn)場外對狀態(tài)信息的傳遞、處理以及在終端實現(xiàn)可視化監(jiān)測的模式構(gòu)成。經(jīng)過監(jiān)測模擬測試,機器人數(shù)據(jù)采集抗干擾結(jié)果符合預期,同時LoRa網(wǎng)關與云服務器數(shù)據(jù)傳輸正常,PC端可實現(xiàn)監(jiān)測狀態(tài)信息可視化查看。

摘要:針對目前網(wǎng)絡評論文本情感分類準確性不高的問題,提出一種基于BERT和雙向門控循環(huán)單元(BiGRU)的改進模型,使用能夠表征文本豐富語義特征的BERT模型進行詞向量表示,結(jié)合能夠長期保留文本上下文關聯(lián)信息的BiGRU神經(jīng)網(wǎng)絡提高模型的分類效果,并在此基礎上引入注意力機制,突出文本中更能表達分類結(jié)果的情感詞權(quán)重,提高情感分類的準確率。將上述模型分別在Acllmdb_v1和酒店評論兩個公開數(shù)據(jù)集上進行測試,實驗結(jié)果表明,該模型在中、英文文本情感分類任務中都獲得了良好的性能。

摘要:道路交通標志檢測是智能交通的重要環(huán)節(jié)之一,針對交通標志檢測存在背景復雜、目標較小、檢測速度慢等問題,選取工業(yè)界青睞的YOLOv3模型提出一種改進的檢測方法。利用雙向特征金字塔結(jié)構(gòu)實現(xiàn)圖像低、中、高層特征語意信息的雙向融合,提升低層預測目標的分類和高層預測目標的定位能力;將原模型的主干特征提取網(wǎng)絡進行改進,提出Darknet23網(wǎng)絡,以提高網(wǎng)絡的提取能力和減少計算量;根據(jù)目標形狀的特點,使用K-means聚類算法得到用于訓練合適的錨點框,并在邊框回歸中引入靈活性更強的L_(α-CIOU)損失函數(shù),使網(wǎng)絡朝著預測框與真實框重疊度較高的方向去優(yōu)化。實驗結(jié)果表明,該方法在CCTSDB數(shù)據(jù)集上mAP@0.75達到86.10%、mAP@0.5:0.05:0.95達到70.017%,相比原網(wǎng)絡分別提升10.17%和5.656%,參數(shù)量減少3 622 091,速度提升8.27 f/s,且優(yōu)于SSD和Faster RCNN等主流的檢測網(wǎng)絡。

摘要:近年來,隨著大數(shù)據(jù)時代進入人類的生活之后,人們的生活中出現(xiàn)很多無法識別的文本、語義等其他數(shù)據(jù),這些數(shù)據(jù)的量十分龐大,語義也錯綜復雜,這使得分類任務更加困難。如何讓計算機對這些信息進行準確的分類,已成為當前研究的重要任務。在此過程中,中文新聞文本分類成為這個領域的一個分支,這對國家輿論的控制、用戶日常行為了解、用戶未來言行的預判都有著至關重要的作用。針對新聞文本分類模型參數(shù)量多和訓練時間過長的不足,在最大限度保留模型性能的情況下壓縮訓練時間,力求二者折中,故提出基于BERT-CNN的知識蒸餾。根據(jù)模型壓縮的技術(shù)特點,將BERT作為教師模型,CNN作為學生模型,先將BERT進行預訓練后再讓學生模型泛化教師模型的能力。實驗結(jié)果表明,在模型性能損失約2.09%的情況下,模型參數(shù)量壓縮約為原來的1/82,且時間縮短約為原來的1/670。

摘要:在無聲或噪聲干擾嚴重的環(huán)境下,或?qū)τ诖嬖诼犛X障礙的人群,唇語識別至關重要。針對詞語級中文唇語識別的問題,提出了SinoLipReadingNet模型,前端采用Conv3D+ResNet34結(jié)構(gòu)用于時空特征提取,后端分別采用Conv1D結(jié)構(gòu)和Bi-LSTM結(jié)構(gòu)用于分類預測,并引入Self-Attention、CTCLoss對Bi-LSTM后端進行改進。最終在新網(wǎng)銀行唇語識別數(shù)據(jù)集上進行實驗,結(jié)果表明,SinoLipReadingNet模型在識別準確率上明顯優(yōu)于中科院D3D模型,多模型融合的預測準確率達到了77.64%,平均字錯率為21.68%。

摘要:為了解決常見目標檢測算法在課堂場景中難以有效應用的問題,提出了一種融合輕量化與梯形結(jié)構(gòu)的學生行為檢測算法。該算法基于YOLOv4架構(gòu),針對目標分類和分布空間的特點,提出一種新的“梯”形特征融合結(jié)構(gòu),并結(jié)合MobileNetv2思想,優(yōu)化模型參數(shù)得到梯形-MobileDarknet19特征提取網(wǎng)絡,既減少了網(wǎng)絡的計算量,提高了工作效率,同時加強了目標特征的信息傳輸,提升了模型學習能力;在尺度檢測階段引入5層的DenseNet網(wǎng)絡,增強網(wǎng)絡對小目標的檢測能力。實驗結(jié)果表明,提出的YOLOv4-ST算法相比于原YOLOv4算法mAP提高了5.5%,相比于其他主流算法,在學生課堂行為檢測任務中具有較好的實用性。

摘要:在復雜的靶場試驗場景中,試驗現(xiàn)場常常涉及揚塵、強光、遮擋等多變的自然環(huán)境。針對這種情況下快速運動的目標物體跟蹤,提出了一種關聯(lián)動態(tài)特征的單目標跟蹤算法。首先使用門控循環(huán)單元(Gated Recurrent Unit,GRU)提取待跟蹤目標的時序動態(tài)特征,獲得候選處理目標框集合;然后利用卷積網(wǎng)絡(Convolutional Neural Network,CNN)提取候選目標框的深度卷積特征并確定目標位置,同時分離出背景卷積特征;在跟蹤過程中,使用分離出的背景卷積特征圖對網(wǎng)絡進行參數(shù)更新,增強網(wǎng)絡的魯棒性與自適應性。實驗結(jié)果表明,所提出的算法可以對靶場圖像采集系統(tǒng)中的被試移動目標進行自適應跟蹤,并且在復雜環(huán)境背景下算法仍能保持優(yōu)異的魯棒性與適應性。

摘要:實體對齊是實現(xiàn)對不同來源知識庫進行融合的重要技術(shù)方法,在知識圖譜、知識補全領域具有廣泛應用?,F(xiàn)有基于圖注意力的實體對齊模型多使用靜態(tài)圖注意力網(wǎng)絡且忽略了實體屬性中的語義信息,導致模型存在有限注意、難以擬合、表達能力不足等問題。針對這些問題,開展基于動態(tài)圖注意力結(jié)構(gòu)建模實體對齊方法研究,首先使用圖卷積層建模目標實體的單跳節(jié)點表示,其次應用動態(tài)圖注意力網(wǎng)絡獲得多跳節(jié)點注意力系數(shù)并建模,再次利用逐層門控網(wǎng)絡聚合圖卷積層與動態(tài)圖注意力層輸出的單跳、多跳節(jié)點信息,最后拼接通過外部知識預訓練自然語言模型提取的實體名稱屬性嵌入并進行相似度計算。該方法在DBP15K的三類跨語言數(shù)據(jù)集中都獲得了一定的提高,證明了應用動態(tài)圖注意力網(wǎng)絡與融入實體屬性語義在提高實體表示能力上的有效性。

摘要:隨著各工業(yè)領域的快速發(fā)展,市場對薄規(guī)格、高強度板帶產(chǎn)品的需求快速增加。而熱軋板帶橫斷面形狀是熱軋板帶產(chǎn)品質(zhì)量的主要評價指標。基于數(shù)據(jù)挖掘技術(shù),對軋機數(shù)據(jù)庫中的數(shù)據(jù)進行分析與處理,其中數(shù)據(jù)挖掘技術(shù)采用深度置信網(wǎng)絡(Deep Belief Neural,DBN)和BP(Back Propagation)算法相結(jié)合,構(gòu)建板帶橫向厚度分布的預測模型。DBN-BP算法由多個限制玻爾茲曼網(wǎng)絡(Restricted Botlzmann Machine,RBM)逐層堆疊而成,并使用無監(jiān)督的逐層訓練的方式得到網(wǎng)絡的權(quán)值矩陣和偏置供BP算法使用,而BP算法通過誤差反向傳播的方式對整個網(wǎng)絡進行微調(diào)。該方法克服了BP算法因隨機初始化權(quán)值參數(shù)而陷入局部最優(yōu)和訓練時間長的缺點。通過與BP算法相比較可知,采用DBN-BP方法預測終軋道次穩(wěn)定軋制時板帶中點厚度誤差在±5.6 μm范圍內(nèi)的概率可達95%;而BP算法的預測誤差范圍為±11 μm。并且通過對板帶橫斷面形狀的預測結(jié)果分析可知,相比于BP算法,DBN-BP深度學習方法對于板帶邊部厚度的預測更具有優(yōu)勢。

摘要:情緒與人類的行為、家庭及社會密切相關。情緒不僅能反映人類的各種感覺、思想和行為,而且也是各種外部刺激所產(chǎn)生的心理和生理反應,所以在很多領域中對情緒的正確識別十分重要。情緒的變化會導致腦電圖(EEG)信號發(fā)生變化,反之,這些變化也反映了情緒狀態(tài)?;贒EAP數(shù)據(jù)庫,對EEG信號進行時域特征和頻域特征提取,通過PCA主成分分析法對特征進行降維處理。利用加權(quán)KNN算法進行5折交叉驗證訓練,最終對興奮(excited)、放松(relaxed)、沮喪(depressed)、憤怒(angry)4種情緒狀態(tài)的識別準確率達到80%。

摘要:在信息化戰(zhàn)爭中,人機交互在指揮控制裝備中的應用日益廣泛。采用語音識別方式代替鍵盤、旋鈕、按鍵等方式更改電臺參數(shù),使其操作更智能化、更便捷。本系統(tǒng)將LD3320語音識別芯片采集到的語音進行處理,通過主控芯片STM32F407發(fā)送相關協(xié)議控制電臺的系列操作。通過實驗表明,該系統(tǒng)在語音識別識別率達到95%左右,能實現(xiàn)對電臺的改頻、開關等操作。

摘要:局部放電是設備處于高電場強下,由于電場分布不均而導致的絕緣介質(zhì)放電現(xiàn)象,設備產(chǎn)生局部放電對于絕緣層的危害很大,迅速檢測識別設備的放電類型是工業(yè)正常運作的保障。針對電氣設備局部放電類型識別問題,考慮到電氣設備監(jiān)測系統(tǒng)在診斷識別方面的時效性及精度,提出了基于邊緣計算的局部放電模式識別方法,利用邊緣計算架構(gòu)的優(yōu)勢,基于云層訓練、邊緣推理思路,將復雜的識別算法訓練優(yōu)化過程部署在云層,將計算量大的識別算法卸載到邊緣層,而計算量小的特征提取保留在終端設備層處理。通過構(gòu)造局部放電相位分布譜圖提取局部放電的統(tǒng)計特征參數(shù),采用粒子群優(yōu)化算法對廣義回歸神經(jīng)網(wǎng)絡模型進行優(yōu)化,最后將統(tǒng)計特征參數(shù)作為神經(jīng)網(wǎng)絡的輸入量,對放電類型進行識別。結(jié)果表明,所提模式識別方法識別準確率高,識別效率高。

摘要:現(xiàn)有的基于圖神經(jīng)網(wǎng)絡的推薦算法能夠利用圖結(jié)構(gòu)信息使得推薦效果得到較好的提升,但主要的圖結(jié)構(gòu)都是圍繞著用戶和項目的一種交互,卻忽略了用戶的多種行為,如點擊、收藏、分享、加入購物車等都表達著用戶不同的語義;又如評論信息,可能影響著該類型物品的下一次購買意圖。為此提出一種基于用戶行為和評論信息的圖神經(jīng)網(wǎng)絡推薦算法,算法通過圖卷積網(wǎng)絡學習用戶行為的強度及語義,再利用評論文本圖表示學習評論中用戶和商品的偏好,最后進行融合提升推薦效果。實驗結(jié)果表明,該算法對于推薦效果有一定的提升。

摘要:隨著電動汽車規(guī)模化發(fā)展,充電站負荷對電網(wǎng)造成一定影響,為保障電網(wǎng)平穩(wěn)運行,提出一種基于極端梯度提升(eXtreme Gradient Boosting,XGBoost)與輕量級梯度提升機(Light Gradient Boosting Machine,LightGBM)融合的電動汽車充電負荷預測模型。該方法運用Stacking集成學習的策略:首先根據(jù)時間特征與歷史負荷數(shù)據(jù)采用XGBoost與LightGBM算法構(gòu)建負荷預測的基學習器,然后采用嶺回歸(Ridge Regression,RR)算法將基學習器的輸出結(jié)果進行融合之后輸出負荷預測值。為了對比多種不同的負荷預測模型,采用上海市嘉定區(qū)的充電站訂單數(shù)據(jù)進行試驗,結(jié)果表明,該方法所構(gòu)建的負荷預測模型相比單一算法模型具有更高的預測準確度,對電網(wǎng)平穩(wěn)運行有一定理論及實用價值。

摘要:對基于極化SAR影像的地物分類技術(shù)發(fā)展進行歸納與總結(jié)。首先提出地物分類技術(shù)的價值需求和應用特點,對其所要解決的科學問題進行歸納;其次總結(jié)分析極化SAR影像分類的一般技術(shù)流程;進一步對國內(nèi)外研究現(xiàn)狀與技術(shù)算法特點進行分類梳理,提出其在理論方法與地物分類應用中的技術(shù)優(yōu)缺點,尤其對基于人工智能理論的極化SAR影像地物分類技術(shù)進行探討;最后結(jié)合SAR遙感的發(fā)展趨勢,指出未來極化SAR影像地物智能分類技術(shù)的研究方向。

摘要:隨著車聯(lián)網(wǎng)的快速發(fā)展,車載應用大多是計算密集和延遲敏感的。車輛是資源受限的設備,無法為這些應用提供所需的計算和存儲資源。邊緣計算通過將計算和存儲資源提供給網(wǎng)絡邊緣的車輛,有望成為滿足低延遲需求的有效解決方案。這種將任務卸載到邊緣服務器的計算模式不僅可以克服車輛資源的不足,還可以避免將任務卸載到云可能導致的高延遲。提出了一種基于深度強化學習的任務卸載方法,以最小化任務的平均完成時間。首先,把多任務卸載決策問題規(guī)約為優(yōu)化問題。其次,使用深度強化學習對優(yōu)化問題進行求解,以獲得具有最小完成時間的優(yōu)化卸載策略。最后,實驗結(jié)果表明,該方法的性能優(yōu)于其他基準方法。

摘要:目標檢測算法在視頻監(jiān)控領域有著較大的實用價值。針對當前在資源受限的視頻監(jiān)控系統(tǒng)中實現(xiàn)實時目標檢測較為困難的情況,提出了一種基于YOLOv3-tiny改進的目標檢測算法。該算法在YOLOv3-tiny架構(gòu)的基礎之上,通過添加特征重用來優(yōu)化骨干網(wǎng)絡結(jié)構(gòu),并提出全連接注意力混合模塊來學習到更豐富的空間信息,更適合資源約束條件下的目標檢測。實驗數(shù)據(jù)表明,該算法相比于YOLOv3-tiny在模型體積降低39.2%,參數(shù)量降低39.8%,且在VOC數(shù)據(jù)集上提高了2.7%的mAP,在提高檢測精度的同時顯著降低了模型資源占用。

摘要:針對臨床醫(yī)生在診斷肝包蟲病時需要通過個人經(jīng)驗判斷囊型肝包蟲病分型,研究基于目標檢測算法的肝包蟲病灶自動檢測與分類模型,實現(xiàn)對肝包蟲病超聲影像的自動識別與分類。使用YOLOv5l模型作為囊型肝包蟲病病灶目標檢測的模型,利用本地肝包蟲病超聲影像數(shù)據(jù)集對網(wǎng)絡模型進行訓練?;赮OLOv5l模型與隨機梯度下降算法(SGD)優(yōu)化算法的肝包蟲病病灶自動檢測分類模型可以很好地對5種類型的病灶進行有效的檢測,平均精度均值(mAP)為88.1%,經(jīng)過測試,該模型的測試速度可達40 f/s。實驗結(jié)果表明,基于YOLOv5l與SGD算法的肝包蟲病病灶自動檢測分類模型能夠較好地識別病灶的具體位置,可以很好地輔助醫(yī)生診斷肝包蟲病。

摘要:車輛屬性檢測是一個基礎任務,其屬性檢測結(jié)果可以被應用到很多下游的交通視覺任務。提出了一種基于YOLOv5的車輛屬性檢測改進算法。針對檢測目標較小的問題,加入了卷積注意力模塊,讓網(wǎng)絡模型把更多的注意力放在小目標對象上;針對數(shù)據(jù)集樣本種類較少的問題,改進了YOLOv5的馬賽克數(shù)據(jù)增強方式;使用自門控激活函數(shù)Swish,起到抑制噪聲、加快收斂速度并提升模型魯棒性的作用。此外,還在公開車輛數(shù)據(jù)集VeRi-776的基礎上進行了詳細的車輛屬性標注,構(gòu)建了一個車輛屬性數(shù)據(jù)集。實驗結(jié)果表明,改進后的算法比原始YOLOv5的平均精確率提升了4.6%,能夠準確地檢測到車輛圖像的通用屬性,可以供下游任務使用。

摘要:癌癥患者的激增引起了全世界的關注,許多研究者將目光放在了對化合物致癌性的評估上,但這是一項極其具有挑戰(zhàn)性的任務。本實驗獲取了341種實驗數(shù)據(jù),利用三維圖卷積網(wǎng)絡(SGCN),建立了對化合物致癌性的預測模型。結(jié)果表明:對化合物進行致癌性預測的SGCN分類模型準確率高達96.9%,比其余模型效果更好,這表明SGCN模型能夠準確地對化學品進行分類,并且在實際應用中具有相當大的潛力。

摘要:現(xiàn)有的空氣質(zhì)量預測方法很少考慮季節(jié)性因素,且預測的效果不佳,因此提出一種基于改進二元混沌烏鴉搜索算法(Binary Chaotic Crow Search Algorithm,BCCSA)和深層長短期記憶神經(jīng)網(wǎng)絡(Long Short Term Memory,LSTM)的空氣質(zhì)量預測方法。首先提出季節(jié)調(diào)整的方法對收集的原始空氣質(zhì)量數(shù)據(jù)進行預處理,以消除季節(jié)對預測的影響;然后提出改進BCCSA,對空氣質(zhì)量數(shù)據(jù)進行優(yōu)化處理;最后,將自注意力機制加入到深層LSTM中,對空氣質(zhì)量數(shù)據(jù)進行預測。實驗結(jié)果表明,該方法能有效地提高空氣質(zhì)量的預測精度。

摘要:針對腦電信號(EEG)運動想象分類過程中弱相關特征量影響分類準確度的問題,提出一種篩選方法,該方法是基于α波和主成分分析(PCA)算法的?;谀X機接口(BCI)系統(tǒng),通過聽覺誘發(fā)刺激產(chǎn)生向左和向右兩種運動想象任務對應的腦電信號,并對其做小波包分解處理,然后進行腦電α頻段信號的重構(gòu),從而提取出α波形并對其進行統(tǒng)計特征提取。再結(jié)合PCA技術(shù)和支持向量機(SVM)方法,實現(xiàn)弱相關特征的剔除和特征分類。根據(jù)篩選后的數(shù)據(jù)進行分類,所得結(jié)果準確率更高,信號分類的準確度由90.1%提高至94.0%。

摘要:隨著近年來人機語音交互場景不斷增加,利用麥克風陣列語音增強提高語音質(zhì)量成為研究熱點之一。與環(huán)境噪聲不同,多說話人分離場景下干擾說話人語音與目標說話人同為語音信號,呈現(xiàn)類似的時、頻特性,對傳統(tǒng)麥克風陣列語音增強技術(shù)提出更高的挑戰(zhàn)。針對多說話人分離場景,基于深度學習網(wǎng)絡構(gòu)建麥陣空間響應代價函數(shù)并進行優(yōu)化,通過深度學習模型訓練設計麥克風陣列期望空間傳輸特性,從而通過改善波束指向性能提高分離效果。仿真和實驗結(jié)果表明,該方法有效提高了多說話人分離性能。

摘要:城市交通日益擁堵的今天,為用戶推薦最快行駛路線成為一個研究熱點。行駛路線推薦的核心問題是對路線將來某段時間(途徑這段線路時)交通狀況的預測。交通狀況受到路線本身狀況、行駛時間、天氣狀況、駕駛員習慣等多種因素影響,其變化快、變化方式復雜,難以準確預測。對多階馬爾可夫鏈模型進行了改進,提高了運算效率和響應速度,建立一種高效的交通狀況預測模型,經(jīng)北京市實際交通數(shù)據(jù)的檢驗,得到了比較好的預測效果。

摘要:佩戴口罩可以有效預防病毒的傳播,為減少通過人工方式檢查口罩佩戴情況所消耗的大量人力資源,提出一種基于深度學習的口罩佩戴檢測與跟蹤方法,該方法分為檢測和跟蹤兩個模塊。檢測模塊在YOLOv3網(wǎng)絡的基礎上引入空間金字塔池化結(jié)構(gòu),實現(xiàn)不同尺度的特征融合;然后將損失函數(shù)改為CIoU損失,減少回歸誤差,提升檢測精度,為后續(xù)跟蹤模塊提供良好的條件。跟蹤模塊采用多目標跟蹤算法Deep SORT,對檢測到的目標進行實時跟蹤,有效防止重復檢測,改善被遮擋目標的跟蹤效果。測試結(jié)果表明,該方法的檢測速度為38 f/s,平均精度值達到為85.23%,相比原始YOLOv3算法提高了4%,能達到實時檢測口罩佩戴情況的效果。

摘要:針對水下機器人對于探測海洋具有的高靈敏度、低成本、易攜帶特點的要求,設計和實現(xiàn)面向水下目標的雙目視覺測距檢測方法。采用張正友標定算法,通過使用9×9棋盤獲取水下雙目相機的內(nèi)外矩陣模型的參數(shù),采用SGBM(Semi-Global Block Matching)立體匹配算法,增強了圖像的對比度,削弱了圖像色斑的影響,保證了算法的魯棒性,提升了匹配搜索速度。將視差圖通過矩陣運算轉(zhuǎn)化成深度圖,并將其映射成可視化點云,構(gòu)建目標物體的三維立體信息。

摘要:推薦效率低、推薦質(zhì)量有待提高等問題普遍存在于傳統(tǒng)協(xié)同過濾推薦算法中,為了改善并解決這些問題,在協(xié)同過濾推薦算法中將混合聚類與用戶興趣偏好融合,經(jīng)過驗證推薦質(zhì)量有顯著提升。首先根據(jù)用戶的個人相關信息構(gòu)建Canopy+bi-Kmeans的一種多重混合聚類模型,采用提出的混合聚類模型把所有用戶劃分成多個聚類簇,將每個用戶的興趣偏好融合到生成的聚類簇中,形成新的相似度計算模型;其次利用基于TF-IDF算法的權(quán)重歸類方法計算用戶對標簽的權(quán)重,并使融入時間系數(shù)的指數(shù)衰減函數(shù)捕捉用戶興趣偏好隨時間的變化;最后使用加權(quán)融合將用戶偏好和混合聚類模型相結(jié)合,匹配到更相似的鄰居用戶,計算出項目評分并進行推薦。利用公開數(shù)據(jù)集對比實驗證明,提出的方法能夠提高推薦質(zhì)量和推薦可靠性。

摘要:隨著船舶智能化水平提高,船載遠程會議系統(tǒng)對提高應急處理能力、推進船岸一體化網(wǎng)絡建設有重要意義,麥克風陣列是保證遠程會議系統(tǒng)語音效果和支持多模態(tài)交互的重要語音前端。但船舶艙室狹小尺寸一方面導致只能采用小尺寸麥陣,另一方面小艙室導致的強混響以及嘈雜艙室噪聲也使傳統(tǒng)麥克風陣列算法性能嚴重下降??紤]船舶艙室復雜環(huán)境下小尺寸麥陣DOA估計場景,提出了一種輕量級Mask-DOA估計神經(jīng)網(wǎng)絡模型。該方法在DOA估計神經(jīng)網(wǎng)絡引入Mask算法降低噪聲和混響的干擾,并提取增強后的GCC-PHAT作為網(wǎng)絡特征,從而在小尺寸麥陣上實現(xiàn)高精度DOA估計。仿真和實驗結(jié)果表明,所提出的Mask-DOA模型面對復雜的船舶艙室環(huán)境更魯棒,泛化能力更強。

摘要:交通標志在車輛的安全行駛和自動駕駛中都有著大量的研究。由于交通標志的種類繁多且受各種因素的影響,交通標志的分類檢測也是一個具有挑戰(zhàn)的難題。為此,提出了一種標簽結(jié)合現(xiàn)實道路場景的交通標志分類檢測方法,該方法分為數(shù)據(jù)生成部分和目標檢測部分。實驗結(jié)果表明,利用該方法生成訓練數(shù)據(jù),能夠有效地訓練深度卷積神經(jīng)網(wǎng)絡,實現(xiàn)現(xiàn)實場景交通標志的分類檢測,并且優(yōu)化的檢測模型相比文中提到的模型具有更小的體積和更快的速度。

摘要:電磁導引是一種車輛自動導引方案,廣泛應用于工業(yè)、物流等領域。為解決現(xiàn)有電磁導引方案對車輛機械結(jié)構(gòu)要求較高、易受傳感器預瞄距離短的限制、難以應用于小型自動導引車輛的問題,提出了一種基于全連接神經(jīng)網(wǎng)絡的導引方案。通過數(shù)據(jù)分析尋找有限預瞄距離內(nèi)的最優(yōu)傳感器排布方案,設計和訓練全連接神經(jīng)網(wǎng)絡模型,對車身姿態(tài)及車后道路的信息進行全面預測,以彌補傳感器短預瞄所造成的前向道路探測能力的不足。經(jīng)模擬和實際測試,該方案能極大改善較小體積車輛的短預瞄電磁導引系統(tǒng)的控制效果,實現(xiàn)車輛的穩(wěn)定快速運行。

摘要:當前使用門控循環(huán)單元(Gated Recurrent Units,GRU)神經(jīng)網(wǎng)絡進行流量預測時,普遍存在滯后性以及預測準確性不高的問題,因此提出一種改進的GRU模型進行流量預測的方法。首先基于GRU神經(jīng)網(wǎng)絡提出一種雙向GRU神經(jīng)網(wǎng)絡和人工神經(jīng)網(wǎng)絡堆疊的網(wǎng)絡模型,適用于流量特征、時間特征、事件特征等多維向量的輸入;同時為解決部分時間段準確度不高的問題,將訓練樣本進行日期分類,針對每一類日期生成單獨的網(wǎng)絡模型,能大幅提升預測的準確度以及改善預測的滯后性。最后,為了提升流量峰值的預測準確度,采用樣本的再平衡手段以及自定義損失函數(shù),實驗結(jié)果表明,能較好地達成預期目標。

摘要:互聯(lián)網(wǎng)對人民群眾的生活和工作產(chǎn)生了重要影響,然而網(wǎng)絡空間中隱藏著大量有害的博彩網(wǎng)站或賭博網(wǎng)站,很容易給網(wǎng)民造成損失和困擾,甚至可能擾亂社會秩序,因而研究對此類網(wǎng)站進行高效識別的方法具有重要意義。提出利用深度殘差神經(jīng)網(wǎng)絡解決博彩類網(wǎng)頁識別問題,基于深度殘差網(wǎng)絡的原理設計了算法GamblingRec。經(jīng)驗證,算法準確率達到了95.16%,正樣本召回率為93.21%,表明基于深度殘差神經(jīng)網(wǎng)絡的方法能夠用于博彩類網(wǎng)頁識別,并能達到較高的識別性能。

摘要:針對當下球類陪練機器人人機交互能力不足的問題,提出一種基于樹莓派和YOLOv5目標檢測算法的新型人機交互模式,使機器人實現(xiàn)前進、后退、左移、右移、拋球、踢球6種不同的動作;通過對在3種不同環(huán)境(室內(nèi)、室外晴天、室外陰天)下搜集的人體姿態(tài)數(shù)據(jù)集進行標定、訓練后,得到6種姿態(tài)在3種環(huán)境中測試集上的識別準確率分別為:室內(nèi)96.33%、室外晴天95%、室外陰天94.3%。相比基于特征匹配和其他利用手勢等小目標檢測的算法,基于該算法的機器人具有更高的檢測速度和準確性,使機器人更加智能化。

摘要:針對生活垃圾的高效分類及搬運處理,設計了一款以邊緣嵌入式AI設備Jetson Nano為控制器的光電智能小車系統(tǒng),該系統(tǒng)設計以YOLOv5為目標檢測算法,以Pytorch1.8.1為深度學習框架。使智能小車從指定區(qū)域出發(fā),通過自身的光電傳感器在指定范圍內(nèi)搜尋垃圾,利用六軸機械臂對垃圾進行分揀并送到指定分類地點。對采集到的5 048張圖片(包括5種垃圾類別)進行300次的迭代訓練,實驗測試結(jié)果表明:平均精確度達到91.8%,準確率達到94.5%,召回率達到89.03%。

摘要:近年來,如何通過人工智能對人的面部表情進行識別分析成為一個研究熱點,利用人工智能可以快速地分析人的面部情緒,并以此為基礎進行進一步研究。在深度學習中,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡存在對面部表情特征的提取不充分以及計算機參數(shù)量較大的問題,導致分類準確率較低。因此,提出了基于VGG16網(wǎng)絡的人臉表情識別算法,通過與InceptionV3、InceptionResNetV2、ResNet50等模型實驗對比,結(jié)果表明,VGG16神經(jīng)網(wǎng)絡在FER2013PLUS測試數(shù)據(jù)集上的識別準確率為79%,準確率比傳統(tǒng)的卷積神經(jīng)網(wǎng)絡高。

摘要:在自動檢測中,由于道路損傷數(shù)據(jù)集存在小目標損傷難檢測與類別不平衡問題,導致道路損傷檢測的準確率低、虛假率高。為此,在DSSD(Deconvolutional Single Shot Detector)網(wǎng)絡模型的基礎上,提出一種結(jié)合注意力機制和Focal loss的道路損傷檢測算法。首先,采用識別精度更高的ResNet-101作為DSSD模型的基礎網(wǎng)絡;其次,在ResNet-101主干網(wǎng)絡中添加注意力機制,采用通道域注意力和空間域注意力結(jié)合的方式,實現(xiàn)特征在通道維度上的加權(quán)與空間維度上的聚焦,提升對小目標道路損傷的檢測效果;最后,為了減少簡單樣本的權(quán)重,增大難分類樣本的權(quán)重,使用Focal loss來提高整體的檢測效果。在Global Road Damage Detection Challenge比賽所提供的數(shù)據(jù)集上進行驗證,實驗結(jié)果表明,該模型的平均精度均值為83.95%,比基于SSD和YOLO網(wǎng)絡的道路損傷檢測方法的準確率更高。

摘要:針對公共政策的語義分析對比是行政管理重要的研究方向,隨著深度學習、知識圖譜應用越來越廣泛,任何在這一領域改進技術(shù)方法的嘗試都可能帶來較大的進步。將自然語言理解相關技術(shù)應用于產(chǎn)業(yè)政策研究有利于政策的制定與管理。針對軟件產(chǎn)業(yè)政策提出一套基于自然語言理解的技術(shù)分析方法,旨在構(gòu)建政策之間的關聯(lián)關系網(wǎng)絡,以期輔助政府決策。

摘要:由于多源傳感數(shù)據(jù)及其噪聲構(gòu)成復雜的非線性可分空間,數(shù)據(jù)融合是目前在資源受限的傳感網(wǎng)絡中安全、準確和高效地消除冗余數(shù)據(jù)的重要方法。結(jié)合SVM泛化能力強、凸優(yōu)化的特點,側(cè)重分析了非線性可分多源數(shù)據(jù)集轉(zhuǎn)化為高維線性可分空間的可行性方法。仿真實驗結(jié)果表明,寬度參數(shù)范圍預估方法可以加速高斯核寬度參數(shù)的確定。針對多分類情形,仿真實驗結(jié)果表明,通過控制誤差積累,更能確保分類的有效性。

摘要:介紹了中國移動IT云針對IaaS層的智能運維場景體系規(guī)劃,選擇了數(shù)據(jù)基礎較好的兩個典型應用場景“智能化指標異常檢測”和“智能化告警關聯(lián)與溯源”進行了研究和論證,分別分析了兩個場景適用的算法和實現(xiàn)過程,論述了兩個場景實施后的效果評估方法,并經(jīng)實際生產(chǎn)驗證了場景實施的效果。

摘要:基于深度學習的目標檢測算法因其模型復雜度和對計算能力的要求,難以部署在移動設備等低算力平臺上。為了降低模型的規(guī)模,提出一種輕量級目標檢測算法。該算法在自頂向下的特征融合的基礎之上,通過添加注意力機制構(gòu)建特征金字塔網(wǎng)絡,以達到更細粒度的特征表達能力。該模型以分辨率為320×320的圖像作為輸入,浮點運算量只有0.72 B,并在VOC數(shù)據(jù)集上取得了74.2%的mAP,達到了與傳統(tǒng)單階段目標檢測算法相似的精度。實驗數(shù)據(jù)表明,該算法在保持了檢測精度的同時顯著降低了模型運算量,更適合低算力條件下的目標檢測。

摘要:考慮到當前電力行業(yè)仍缺少有效的領域詞發(fā)現(xiàn)方法,以電力行業(yè)科技項目文本為原始語料庫,將基于互信息與左右熵的統(tǒng)計特征與傳統(tǒng)語言構(gòu)詞規(guī)則特征相融合,提出了電力文本成詞率的概念。所提方法首先利用成詞率對電力文本進行無監(jiān)督篩選得到初始候選詞集,然后對候選詞集進行文本切片算法和常用詞過濾操作,最后進行詞嵌入和譜聚類得到最終所需的電力文本領域詞。實驗結(jié)果表明,所提出的方法準確有效,為電力文本的領域詞發(fā)現(xiàn)提供了一種新方法。

摘要:針對Staple算法在由于相機運動出現(xiàn)模糊情況下跟蹤精度下降的問題,提出一種基于背景權(quán)重直方圖的改進Staple目標跟蹤算法。首先,針對傳統(tǒng)顏色直方圖忽略空間性的問題,提出對直方圖引入位置權(quán)重;其次,利用背景區(qū)域顏色直方圖抑制背景信息對目標區(qū)域直方圖的影響,提出引入背景權(quán)重直方圖,并完成直方圖分類器的構(gòu)建。該算法在OTB2015測試集上與其他5個先進算法進行實驗比較,結(jié)果表明在距離精度和成功率上總體效果相對Staple分別提升了3.7%和2%。

摘要:實時監(jiān)測功率變流器中支撐電容的老化狀態(tài),及時發(fā)現(xiàn)并更換存在缺陷的電容,對提高功率變換器的可靠性具有重要意義?;谙嚓P電壓電流數(shù)據(jù),通過建立數(shù)據(jù)集,確定網(wǎng)絡模型參數(shù)和模型訓練,最終得到基于CNN-LSTM的神經(jīng)網(wǎng)絡模型,并通過不同工況下的數(shù)據(jù)集對神經(jīng)網(wǎng)絡模型的準確性進行了驗證。結(jié)果表明,該模型可對電容容值進行可靠預測。

摘要:為了滿足人們對更好解鎖方式的需求,提出了一種基于語音指令的電子門鎖解鎖方法及系統(tǒng)。該方法的設計理念是:利用手機號碼的唯一性識別用戶身份;利用語音識別技術(shù),實現(xiàn)利用不同的語音指令打開不同門鎖。該系統(tǒng)由電子門鎖、手機和互聯(lián)網(wǎng)服務器組成。對該方法及系統(tǒng)進行了詳細設計和說明,據(jù)此即可進行代碼編寫、電路設計等產(chǎn)品化設計工作?;诒痉椒跋到y(tǒng)的電子門鎖適用范圍寬、解鎖便捷,并具有更好的安全性、更高的性價比,對電子門鎖或智能門鎖行業(yè)的發(fā)展將會產(chǎn)生重要影響。

摘要:基于上交所主板市場A股企業(yè)的財務指標數(shù)據(jù)來預測企業(yè)的財務風險,樣本數(shù)據(jù)包括1 227家正常上市企業(yè)和42家被財務預警的企業(yè),數(shù)據(jù)嚴重不平衡,通過重采樣技術(shù)解決了分類器在不平衡樣本中失效的問題,運用Bagging思想的集成機器學習對預測模型進行提升與優(yōu)化。正確挑選出有財務危機企業(yè)的概率最高達到92.86%,在此基礎上,樣本的整體準確率在經(jīng)過模型的集成之后提高了5.4%。集成模型提高了對上市企業(yè)的財務預警能力,能為企業(yè)的正常經(jīng)營和投資者的安全投資提供一定的借鑒。

摘要:針對人工閱片工作量大、閱片質(zhì)量不佳且容易出現(xiàn)漏檢、錯判等問題,將Faster RCNN目標檢測模型應用于肝包蟲病CT圖像的檢測,并對目標檢測模型進行改進:基于圖片分辨率低、病灶大小不同的特點,使用網(wǎng)絡深度更深的殘差網(wǎng)絡(ResNet101)代替原來的VGG16網(wǎng)絡,用以提取更豐富的圖像特征;根據(jù)目標檢測模型得出的病灶坐標信息引入LGDF模型進一步對病灶進行分割,從而輔助醫(yī)生更高效的診斷疾病。實驗結(jié)果表明,基于ResNet101特征提取網(wǎng)絡的目標檢測模型能夠有效提取目標的特征,檢測準確率相比原始檢測模型提高2.1%,具有較好的檢測精度。同時,將病灶坐標信息引入LGDF模型,相比于原始的LGDF模型更好地完成了對肝包蟲病病灶的分割,Dice系數(shù)提高了5%,尤其對多囊型肝包蟲病CT圖像的分割效果較好。

摘要:特征工程可以自動地處理和生成那些判別性高的特征,而無需人為的操作。特征工程在機器學習中是不可避免的一環(huán),也是至關重要的一環(huán)。提出一種基于強化學習(RL)的方法,將特征工程作為一個馬爾可夫決策過程(MDP),在上限置信區(qū)間算法(UCT)的基礎上提出一個近似的方法求解二分類數(shù)值數(shù)據(jù)的特征工程問題,來自動獲得最佳的變換策略。在5個公開的數(shù)據(jù)集上驗證所提出方法的有效性,F(xiàn)Score平均提高了9.032%,同時與其他用有限元變換進行特征工程的方法進行比較。該方法確實可以得到判別性高的特征,提高模型的學習能力,得到更高的精度。

摘要:隨著信息技術(shù)的發(fā)展,人臉識別在支付、工作和安防系統(tǒng)中應用的越來越多。在邊緣計算系統(tǒng)中,為了處理的速度,通常選擇較小的神經(jīng)網(wǎng)絡進行人臉識別,這樣會導致識別率低。并且在實際應用中大多都是對于圖片質(zhì)量較高的人臉可以很好地識別,但對于受光照影響較大、表情和姿態(tài)變化大的圖片識別率不是很高。因此,選擇SqueezeNet輕量級網(wǎng)絡,該網(wǎng)絡層數(shù)小,可以很好地運用于邊緣計算系統(tǒng)中。采用了預處理的方法來對圖片進行預處理,然后改進了SqueezeNet網(wǎng)絡的損失函數(shù)以及加入了ResNet網(wǎng)絡中的殘差學習方法。最后通過對LFW和IJB-A數(shù)據(jù)集進行測試,該研究方法明顯提高了識別率。

摘要:通信技術(shù)的普及給人們帶來便捷的同時,電信欺詐行為也急劇增加。由于詐騙行為特征、號碼類型等與正常業(yè)務具有極高相似性,傳統(tǒng)基于統(tǒng)計的電信欺詐檢測方法難于篩選。提出將用戶通信關系轉(zhuǎn)換為一組拓撲特征,建立通信社交有向圖,將具有統(tǒng)計特征的頂點表示用戶,具有關系特征的邊表示他們之間的活動。在通信社交圖基礎上,通過圖卷積模塊捕獲用戶的通信行為規(guī)律和通信社交關系特征,通過池化讀出機制聚合通信社交網(wǎng)絡的潛在特征,以識別電信欺詐行為。真實通信歷史數(shù)據(jù)驗證表明了該方法的有效性。

摘要:邊緣設備的快速發(fā)展和深度學習的落地應用越來越多,兩者結(jié)合的趨勢越發(fā)明顯。而針對低功耗邊緣設備AI應用的潛力還未完全開發(fā)出來,大量設備隱藏著大量計算能力,釋放其潛力所帶來的社會效益和經(jīng)濟效益是非常明顯的。因此,以目標檢測任務中較為常見的人臉檢測為例,將MTCNN人臉檢測算法改進并移植到資源極其緊張的低功耗嵌入式平臺,在一定環(huán)境條件下,最終成功地檢測到人臉,并繪制出人臉候選框,結(jié)合舵機云臺具備了一定的人臉跟蹤能力。

摘要:計算機通信網(wǎng)絡技術(shù)高速發(fā)展,日新月異,隨之涌現(xiàn)的網(wǎng)絡攻擊、破壞現(xiàn)象形態(tài)各異、層出不窮。態(tài)勢感知系統(tǒng)為網(wǎng)絡安全提供了全面保障,提高態(tài)勢評估和態(tài)勢預測建模的穩(wěn)定性、精準性和快速性是態(tài)勢感知系統(tǒng)研究的重要方向。深度信念網(wǎng)作為一種深度學習智能算法,為網(wǎng)絡安全態(tài)勢評估和態(tài)勢預測的精確性、理論化帶來新方向??紤]深度信念網(wǎng)算法采用受限玻爾茲曼機作為基礎網(wǎng)絡,逐層預訓練和微調(diào)為網(wǎng)絡核心部分。構(gòu)建廣義網(wǎng)絡安全態(tài)勢評估指標體系,并建立計算機通信網(wǎng)絡安全的態(tài)勢評估和態(tài)勢預測數(shù)據(jù)驅(qū)動模型。通過入侵檢測數(shù)據(jù)集CIC-IDS2017進行實驗仿真,驗證了該模型的精準性和有效性。

摘要:針對微博網(wǎng)絡輿情信息量大、無規(guī)則、隨機變化的特點,提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析,設計與實現(xiàn)了一個基于Scrapy框架的微博評論爬蟲,將某熱點事件的若干條微博評論進行爬取并存進數(shù)據(jù)庫,然后進行文本分割、LDA(Latent Dirichlet Allocation)主題聚類,最后使用TFIDF-NB算法進行情感分類。實驗結(jié)果表明,TFIDF-NB算法平均準確率高于線性支持向量機算法和K近鄰算法,在精確率和召回率方面高于K近鄰算法,具有較好的情感分類效果。

摘要:Tor是一種基于洋蔥路由通信協(xié)議建立的隱蔽加密通信系統(tǒng)。該系統(tǒng)基于互聯(lián)網(wǎng)現(xiàn)有路由、數(shù)據(jù)加密等協(xié)議,構(gòu)建了一套保護通信實體的身份隱匿機制,使得經(jīng)過Tor網(wǎng)絡傳播的數(shù)據(jù)難以被有效追蹤和分析。然而近年來這項隱蔽通信技術(shù)被罪犯大量使用,已成為網(wǎng)絡犯罪和非法交易的溫床。為有效應對該問題,提出一項基于機器學習的Tor網(wǎng)絡識別檢測技術(shù),通過主動生成Tor網(wǎng)絡流量,基于機器學習技術(shù)實施流特征提取與檢測,從而發(fā)現(xiàn)參與Tor通信的網(wǎng)絡實體及其通信類型,進而檢出潛在的惡意暗網(wǎng)用戶。實驗表明,該方法可有效識別Tor通信實體以及通信行為,如電子郵件和FTP應用等。

摘要:卷積神經(jīng)網(wǎng)絡在各個領域都發(fā)揮著重要的作用,尤其是在計算機視覺領域,但過多的參數(shù)數(shù)量和計算量限制了它在移動設備上的應用。針對上述問題,結(jié)合分組卷積方法和參數(shù)共享、密集連接的思想,提出了一種新的卷積算法Group-Shard-Dense-Channle-Wise。利用該卷積算法,在PeleeNet網(wǎng)絡結(jié)構(gòu)的基礎上,改進出一種高效的輕量化卷積神經(jīng)網(wǎng)絡——GSDCPeleeNet。與其他卷積神經(jīng)網(wǎng)絡相比,該網(wǎng)絡在具有更少參數(shù)的情況下,幾乎不損失識別精度甚至識別精度更高。該網(wǎng)絡選取1×1卷積層中卷積核信道方向上的步長s作為超參數(shù),調(diào)整并適當?shù)剡x取該超參數(shù),可以在網(wǎng)絡參數(shù)量更小的情況下,擁有更好的圖像分類效果。

摘要:基于軟硬件協(xié)同設計的思想,利用HLS工具,在PYNQ-Z2平臺上設計并實現(xiàn)了一個卷積神經(jīng)網(wǎng)絡加速器,對卷積運算采用矩陣切割的優(yōu)化方法,均衡了資源消耗和計算資源,使得加速器的性能達到了最優(yōu)。利用MNIST數(shù)據(jù)集對加速器IP核進行性能測試,實驗結(jié)果表明:對單張圖片的測試,該加速器相對于ARM平臺實現(xiàn)了5.785的加速效果,對于1 000張圖片的測試則可達到9.72的加速效果,隨著測試圖片數(shù)量的不斷增加,加速器的性能也將越來越優(yōu)。

摘要:針對汽車造型智能設計領域中如何有效提取用戶需求的問題,提出一種融合多特征TFIDF(詞頻-逆向文件頻率)文本分析的汽車造型需求提取方法。首先,通過基于互信息與邊界自由度獲取大量未登錄的專業(yè)詞匯,優(yōu)化和修正簡單分詞后的詞匯;然后針對經(jīng)典TFIDF算法的局限性,引入詞匯特征因素與情感特征因素,獲取用戶需求特征候選集;最后根據(jù)設定的閾值得到有效的用戶需求。實驗結(jié)果表明,融合多特征TFIDF文本分析算法在特征提取方面有一定優(yōu)勢,能有效提取文本中關于汽車造型的用戶需求。

摘要:群體智能在解決非確定性多項式(NP)問題或搜索空間過大的問題時有著顯著優(yōu)勢。將鴿群優(yōu)化(Pigeon Inspired Optimization,PIO)算法應用于入侵檢測系統(tǒng)的特征選擇中。提出基于Sigmoid的PIO(SPIO)和基于Cosine余弦相似度的PIO(CPIO)算法對入侵檢測數(shù)據(jù)集KDDCUP99進行特征選擇,并用機器學習的方法進行實驗,建立模型并評估結(jié)果。

摘要:缺陷檢測對于古建筑的保護和修繕具有重要的意義,傳統(tǒng)的地磚缺陷檢測通過目視檢查,存在受人力影響大、耗時長等限制。基于深度學習的良好應用前景,建立故宮地磚缺陷的數(shù)據(jù)集,提出改進型Faster R-CNN的網(wǎng)絡。首先,構(gòu)建可變形卷積,通過網(wǎng)絡學習并提取地磚中的缺陷特征;然后,將特征圖輸入?yún)^(qū)域生成網(wǎng)絡中生成候選區(qū)域框,將生成的特征圖和候選區(qū)域框進行池化操作;最后,輸出缺陷檢測結(jié)果。在故宮地磚圖片數(shù)據(jù)集的測試下,改進后的模型平均準確率均值到達92.49%,與Faster R-CNN模型相比提高了2.99%,更適用于地磚缺陷檢測。

摘要:深入分析了當前倒車影像系統(tǒng)在實際使用場景上的不足,介紹了雷達存在的輻射面有限、角度盲區(qū)、物體識別方面的缺陷,以及毫米波雷達的高成本難以普及應用。提出了基于ADAS的汽車倒車防碰撞系統(tǒng)設計,對系統(tǒng)倒車功能做了深入的原理分析,針對基于倒車攝像頭圖像分析的ADAS算法詳細介紹了其技術(shù)關鍵點和基于倒車場景融合特征的創(chuàng)新應用,算法識別效果精準有效。針對不同車輛攝像頭安裝位置和朝向的差異創(chuàng)新設計了靈活的預警和報警區(qū)域的調(diào)節(jié)功能,結(jié)合TTS語音提醒和圖文顯示提醒司機采取合適的操作保障行車安全,極大地改善了該倒車防碰撞系統(tǒng)的用戶體驗和實際作用,為司機的安全行車提供了有力保障。

摘要:提出基于分塊LBP-TOP(Local Binary Patterns from Three Orthogonal Planes)特征和改進的加權(quán)稀疏表示分類解決微表情識別與專用線車輛狀態(tài)檢測問題。首先利用LBP-TOP特征描述符對從分塊圖像中選擇出的有效塊進行提取特征,將提取的特征作為字典,采取加權(quán)稀疏表示(Weighted Sparse Representation,WSRC)和對偶增廣拉格朗日乘子法(Dual Augmented Lagrange Multiplier,DALM)相結(jié)合的算法(WSRC_DALM)進行稀疏表示分類;然后利用不同尺寸的塊劃分圖像,選擇有效塊提取特征,特征融合后參與分類。在CASME Ⅱ與SAMM表情數(shù)據(jù)庫上采用“留一人交叉驗證”(Leave One Subject Out, LOSO)的分類方法進行5分類,得到的識別率分別達到了77.30%與58.82%,在車輛狀態(tài)檢測檢測數(shù)據(jù)庫上的實驗達到了84.60%的檢測率。實驗結(jié)果表明了所提出算法的有效性。

摘要:雨線造成的圖像質(zhì)量退化嚴重影響圖像有效應用及計算機視覺算法,因此圖像去雨十分必要。目前主流的深度學習去雨方法僅對單一尺寸的雨線有效,并且存在雨線去除不完全、模糊背景等問題。針對以上難點,提出了基于深度密集連接控制網(wǎng)絡的單幅圖像去雨算法。通過引入多尺度特征網(wǎng)絡加強對不同尺寸雨線的提取能力,引入注意力機制模塊提升對有雨區(qū)域的關注度,引入密集連接控制網(wǎng)絡以完整表示雨線特征。實驗表明,該方法在合成數(shù)據(jù)集以及真實數(shù)據(jù)集對比主流去雨方法效果均有提升。

摘要:皮膚病是醫(yī)學上的常見的、多發(fā)性疾病,因此皮膚檢測技術(shù)越來越受關注。卷積神經(jīng)網(wǎng)絡是常見的皮膚檢測方法,其模型結(jié)構(gòu)會丟失很多信息。CapsNet(膠囊網(wǎng)絡)是在卷積神經(jīng)網(wǎng)絡之后的一種新的神經(jīng)網(wǎng)絡。CapsNet的矢量化特征能夠較好地表達空間關聯(lián)性,每一個capsule(膠囊)獨立地服務各自的任務。分析了CapsNet的基本結(jié)構(gòu)和主要算法,改進了網(wǎng)絡模型從而避免過擬合現(xiàn)象發(fā)生,試圖基于改進CapsNet針對預處理之后的皮膚圖像進行識別,并與傳統(tǒng)卷積神經(jīng)網(wǎng)絡的模型作對比。實驗結(jié)果表明,使用改進CapsNet對色素性皮膚病進行識別可以有較好的識別效果,并且準確率比傳統(tǒng)方法高出8%~10%。

摘要:在語音增強領域,深度神經(jīng)網(wǎng)絡通過對大量含有不同噪聲的語音以監(jiān)督學習方式進行訓練建模,從而提升網(wǎng)絡的語音增強能力。然而不同類型噪聲的獲取成本較大,噪聲類型難以全面采集,影響了模型的泛化能力。針對這個問題,提出一種基于生成對抗網(wǎng)絡(Generative Adversarial Networks,GAN)的噪聲數(shù)據(jù)樣本增強方法,該方法對真實噪聲數(shù)據(jù)進行學習,根據(jù)數(shù)據(jù)特征合成虛擬噪聲,以此擴充訓練集中噪聲數(shù)據(jù)的數(shù)量和類型。通過實驗驗證,所采用的噪聲合成方法能夠有效擴展訓練集中噪聲來源,增強模型的泛化能力,有效提高語音信號去噪處理后的信噪比和可理解性。

摘要:隨著科學技術(shù)的不斷進步,不法分子竊電手段日趨專業(yè)化多樣化,而傳統(tǒng)的防竊電技術(shù)實時性及可行性較低。研究對運行中智能電能表用電信息的數(shù)據(jù)采集及特征提取,分析異常用電數(shù)據(jù),應用機器學習的方法對特征值進行學習,并推導出用電異常的判斷閾值,采用關聯(lián)規(guī)則數(shù)據(jù)挖掘方法對獨立檢測的結(jié)果進行融合,從而實現(xiàn)竊電數(shù)據(jù)的挖掘。最后驗證了模型建立的準確性,并推導出用電異常案例的甄別方法。

摘要:在數(shù)字化礦山中,行人檢測系統(tǒng)能夠大幅減少事故傷亡,是保護工人安全的重要手段。為了構(gòu)建高性能的行人檢測系統(tǒng),提出了一種基于邊窗濾波和擴張卷積的礦井行人檢測模型。具體來說,針對復雜惡劣的礦井環(huán)境,采用邊窗濾波抑制視頻圖像中的干擾信號,提升圖像質(zhì)量。此外,考慮到行人目標的多尺度特性,在模型中引入擴張卷積增加特征的感受野,進而提升檢測性能。大量的對比實驗證明了邊窗濾波和擴張卷積的有效性,模型在礦井數(shù)據(jù)集上獲得94.3 mAP和99.1%檢測率的優(yōu)異性能。

摘要:傳統(tǒng)的卷積神經(jīng)網(wǎng)絡量化算法廣泛使用對稱均勻量化操作對模型權(quán)值進行量化,沒有考慮到相鄰權(quán)值量化之間的相互關系,即上一個權(quán)值的量化操作產(chǎn)生的量化噪聲可以通過調(diào)整之后權(quán)值的量化方向加以彌補。針對上述問題,提出了一種基于權(quán)值交互思想的三值卷積神經(jīng)網(wǎng)絡量化算法,達到了16倍的模型壓縮比,以ImageNet作為數(shù)據(jù)集,量化后的AlexNet和ResNet-18網(wǎng)絡上模型預測準確率只下降了不到3%。該方法達到了較高的模型壓縮比,具有較高的精度,可以用于將卷積神經(jīng)網(wǎng)絡移植到計算資源有限的移動端平臺上。

摘要:對比于單張圖像超分辨,視頻圖像超分辨率技術(shù)需要對輸入的連續(xù)時間序列圖像進行融合、對齊等處理?;趲h(huán)的視頻超分辨率網(wǎng)絡共分為三部分:(1)幀序列對齊網(wǎng)絡提取圖像特征,并將鄰居幀對齊到中心幀;(2)幀融合網(wǎng)絡將對齊完成的幀進行融合,使用鄰居幀的信息補充中心幀信息;(3)超分辨網(wǎng)絡將融合完成的圖像放大,得到最終的高清圖像。實驗表明,與現(xiàn)有算法相比,基于幀循環(huán)網(wǎng)絡的視頻超分辨率技術(shù)產(chǎn)生圖像更為銳利,質(zhì)量更高。

摘要:在煤礦生產(chǎn)中,工人由于未佩戴安全帽而受傷的事故時有發(fā)生。為了構(gòu)建數(shù)字化安全帽監(jiān)測系統(tǒng),提出了一種基于卷積神經(jīng)網(wǎng)絡的安全帽佩戴檢測模型。采用先進的Darknet53網(wǎng)絡作為模型主干,用于提取圖片的特征信息。此外,在模型中引入注意力機制用于豐富特征之間的信息傳播,增強模型的泛化能力。最后,制作了安全帽佩戴預訓練數(shù)據(jù)集和實際礦井場景數(shù)據(jù)集,并在PyTorch平臺進行全面的對比實驗驗證了模型設計的有效性,模型在實際礦井場景數(shù)據(jù)集上獲得92.5 mAP的優(yōu)異性能。

摘要:針對車標檢測存在檢測時間長、檢測率低、可識別類型少的問題,提出一種采用You Only Look Once(YOLOv3)網(wǎng)絡的方法。為了使該網(wǎng)絡適用于小目標的車標檢測,將目標特征提取結(jié)構(gòu)Darknet-53換成Darknet-19,并且將多尺度預測層數(shù)減少為兩層以減少網(wǎng)絡參數(shù)數(shù)量。同時,為了增大車標在圖像中所占比例,讓卷積神經(jīng)網(wǎng)絡能學習更多的車標特征,采用將車輛從圖像中裁剪后進行人工標注的方法,構(gòu)建了一個包含46類車標的數(shù)據(jù)集(VLDS-46)。實驗結(jié)果表明,采用該模型進行車標檢測時能在實現(xiàn)高檢測率的同時達到實時性要求,檢測平均耗時為9 ms。

摘要:提出一種基于音視頻匹配層自適應加權(quán)融合的身份識別方法。在不同程度的噪聲情況下,圖像與聲音的識別率會隨噪聲的增強而降低,憑借單個生物模態(tài)的識別,難以達到很好的預測結(jié)果;而且兩種模態(tài)融合時的權(quán)值不同,融合系統(tǒng)的穩(wěn)定性效果也不同。采用雙模態(tài)的自適應加權(quán)融合不僅可以有效地彌補不同生物模態(tài)識別之間的優(yōu)缺點,而且可以自適應選擇最優(yōu)的權(quán)值進行決策。實驗表明,該方法的理論推測成立,比單模態(tài)的身份識別具有更高的識別率與魯棒性。

摘要:傳統(tǒng)的道路裂縫識別方法有基于R-CNN、SPPnet、HOG+SVM等多種方法,但識別精度低、檢測速度慢。針對這些缺點,提出一種基于Faster R-CNN的道路裂縫識別方法。首先,采集道路裂縫圖像,建立Pascal VOC數(shù)據(jù)集;其次,基于谷歌開發(fā)的TensorFlow深度學習框架,用數(shù)據(jù)集對Faster R-CNN進行訓練并分析各項性能參數(shù)指標。實驗結(jié)果表明,在迭代20 000次的情況下,可將訓練損失降到0.188 5,AP值達到0.780 2,取得了良好效果。

摘要:非法入侵者通過偽裝人臉欺騙識別系統(tǒng), 給人臉識別應用帶來嚴重威脅?,F(xiàn)有人臉活體檢測方法多為在同一數(shù)據(jù)集內(nèi)進行訓練和測試,當應用在跨數(shù)據(jù)集場景中時效果并不理想。針對這一問題,提出了利用HOG等算法對上下文環(huán)境中的線索信息進行提取,提取出來的特征送入單類支持向量機進行訓練、分類。將分類結(jié)果與上下文環(huán)境中異常線索的探測結(jié)果相結(jié)合。算法在公開的數(shù)據(jù)集NUAA和CASIA-FASD上進行了驗證,實驗結(jié)果表明在跨數(shù)據(jù)集檢測時該算法的泛化能力及檢測準確率較已存在算法有所提高。

摘要:為了提高文本相似度檢測算法的準確度,提出一種結(jié)合潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)與Doc2Vec模型的文本相似度檢測方法,并把該算法得到的模型命名為HybridDL模型。該算法通過Doc2Vec對文檔訓練得到文檔向量,再利用LDA模型得到文檔主題與各個主題下特征詞出現(xiàn)的概率,對文檔中各主題及特征詞計算概率加權(quán)和,映射到Doc2Vec文檔向量中。實驗結(jié)果表明,新算法模型比傳統(tǒng)的Doc2Vec模型對相似文本的判斷更加敏感,在文本相似度檢測上具有更高的準確度。

摘要:現(xiàn)有的文本相似度度量方法主要采用TF-IDF方法,把文本建模為詞頻向量,但未考慮文本的結(jié)構(gòu)特征。現(xiàn)將文本的結(jié)構(gòu)特征和TF-IDF方法進行融合,提出了一種面向科技項目文本的相似度度量方法。該方法首先對文本進行預處理,其次根據(jù)文本的結(jié)構(gòu)特征提取模塊文本,然后使用TF-IDF方法提取每個模塊文本的TOP-N關鍵詞, 作為模塊文本的特征向量表示,最后使用余弦聚類計算文本的相似度。實驗結(jié)果表明,在電力行業(yè)的科技項目文檔數(shù)據(jù)集上,所提方法優(yōu)于TF-IDF方法。

摘要:偽裝人臉識別在刑偵安防領域有著巨大的應用價值。針對現(xiàn)階段對偽裝人臉識別的研究較少、算法魯棒性不強等缺點,提出了基于深度神經(jīng)網(wǎng)絡的偽裝人臉識別算法。改進了SqueezeNet網(wǎng)絡模型,并將其與FaceNet網(wǎng)絡架構(gòu)進行結(jié)合,用于人臉圖像的身份識別。通過在訓練數(shù)據(jù)集中引入偽裝人臉圖像,讓網(wǎng)絡學習到偽裝的特征。實驗結(jié)果表明,該算法識別準確率接近90%,相較于其他網(wǎng)絡模型,具有更好的識別效果。

摘要:傳統(tǒng)的道岔故障檢測方式不僅會耗費大量人力、物力、財力,而且檢測結(jié)果完全依賴于個人工作經(jīng)驗。 隨著人工智能的飛速發(fā)展,研究鐵路道岔的智能診斷器是亟待解決的問題。提出一種智能檢測系統(tǒng),該系統(tǒng)從預處理數(shù)據(jù)、特征提取、構(gòu)建不均衡數(shù)據(jù)的智能識別器以及設計更符合要求的評價標準方面進行了具體而深入的研究。 最后,通過MATLAB軟件對廣州鐘村站W(wǎng)1902#和W1904#型號的道岔動作電流數(shù)據(jù)進行仿真實驗。實驗結(jié)果顯示,智能檢測系統(tǒng)不僅具有非常高的識別性能和泛化能力,而且識別時間僅為0.04 s, 滿足鐵路實時性要求。

摘要:針對傳統(tǒng)話題檢測方法在微博短文本上存在高維稀疏的缺陷,提出了一種基于特征融合的K-means微博話題發(fā)現(xiàn)模型。為了更好地表達微博話題的語義信息,使用在句子中共現(xiàn)的詞對向量模型(Biterm_VSM)代替?zhèn)鹘y(tǒng)的向量空間模型(Vector Space Model,VSM),并結(jié)合主題模型(Latent Dirichlet Allocation,LDA)挖掘出微博短文本中的潛在語義,把兩個模型得到的特征進行特征融合,并應用K-means聚類算法進行話題的發(fā)現(xiàn)。實驗結(jié)果表明,與傳統(tǒng)的話題檢測方法相比,該模型的調(diào)整蘭德系數(shù)(Adjusted Rand index,ARI)為0.80,比傳統(tǒng)的話題檢測方法提高了3%~6%。

摘要:研究了利用人工神經(jīng)網(wǎng)絡對不同頻帶、柵寬的砷化鎵高電子遷移率晶體管進行散射參數(shù)和噪聲參數(shù)提取,基于兩個神經(jīng)網(wǎng)絡分別對兩組散射參數(shù)和噪聲參數(shù)進行訓練學習,比較不同隱含層和神經(jīng)元數(shù)目得出平均相對誤差和均方誤差,找到對應散射參數(shù)和噪聲參數(shù)神經(jīng)網(wǎng)絡的最佳的隱含層數(shù)和神經(jīng)元數(shù)目是8-8-6和6-4。測試結(jié)果表明,散射參數(shù)平均相對誤差的平均值為2.79%,噪聲參數(shù)平均相對誤差的平均值為2.05%,與常規(guī)單個神經(jīng)網(wǎng)絡結(jié)構(gòu)相比,在平均相對誤差方面提高了31.3%,表明該模型具備更好的精度和可靠性,十分適用于寬禁帶、強非線性特征的射頻晶體管參數(shù)提取。

摘要:針對中文文本自動校對提出了一種新的基于Seq2Seq和Bi-LSTM結(jié)合的深度學習模型。與傳統(tǒng)的基于規(guī)則和概率統(tǒng)計的方法不同,基于Seq2Seq基礎結(jié)構(gòu)改進,加入了Bi-LSTM單元和注意力機制,實現(xiàn)了一個中文文本自動校對模型。采用F0.5與GLEU指標評價,通過公開的數(shù)據(jù)集進行不同模型的對比實驗。實驗結(jié)果表明,新模型能有效地處理長距離的文本錯誤以及語義錯誤,Bi-RNN以及注意力機制的加入對中文文本校對模型的性能有顯著提升。

摘要:針對傳統(tǒng)的淺層特征所提取特征的判別性有限、深度特征需要大量帶標記樣本且訓練過程耗時長的問題,提出一種深度及淺層特征融合算法用于人臉識別。首先提取人臉的HOG特征并進行判別性降維;同時,提取人臉圖像的PCANet特征并降維;其次,將降維后的深淺特征進行融合,并進一步提取判別性特征;最后,采用SVM分類器進行分類并在AR和Yale B數(shù)據(jù)庫上對算法進行驗證。實驗結(jié)果證明,該算法能夠比單獨選用深度特征和淺層特征進行分類達到更高的識別率,且對特征維數(shù)具有更強的魯棒性。

摘要:針對卷積神經(jīng)網(wǎng)絡(CNN)在通用CPU以及GPU平臺上推斷速度慢、功耗大的問題,采用FPGA平臺設計了并行化的卷積神經(jīng)網(wǎng)絡推斷系統(tǒng)。通過運算資源重用、并行處理數(shù)據(jù)和流水線設計,并利用全連接層的稀疏性設計稀疏矩陣乘法器,大大提高運算速度,減少資源的使用。系統(tǒng)測試使用ORL人臉數(shù)據(jù)庫,實驗結(jié)果表明,在100 MHz工作頻率下,模型推斷性能分別是CPU的10.24倍,是GPU的3.08倍,是基準版本的1.56倍,而功率還不到2 W。最終在模型壓縮了4倍的情況下,系統(tǒng)識別準確率為95%。

摘要:傳統(tǒng)人臉檢測算法往往不能自動地從原始圖像中提取有用的檢測特征,而卷積神經(jīng)網(wǎng)絡可以輕易地提取高維度的特征信息,廣泛用于圖像處理領域。針對上述缺點,采用簡單高效的深度學習Caffe框架并通過AlexNet網(wǎng)絡訓練,數(shù)據(jù)集為LFW人臉數(shù)據(jù)集,得出一個模型分類器,對原始圖像數(shù)據(jù)進行圖像金字塔變換,并通過前向傳播得到特征圖,反變換得出人臉坐標,采用非極大值抑制算法得出最優(yōu)位置,最后達到一個二分類的人臉檢測結(jié)果。該方法可以實現(xiàn)不同尺度的人臉檢測,具有較高的精度,可用于構(gòu)建人臉檢測系統(tǒng)。

摘要:提出將Transformer模型應用于中文文本自動校對領域。Transformer模型與傳統(tǒng)的基于概率、統(tǒng)計、規(guī)則或引入BiLSTM的Seq2Seq模型不同,該深度學習模型通過對Seq2Seq模型進行整體結(jié)構(gòu)改進,從而實現(xiàn)中文文本自動校對。通過使用公開數(shù)據(jù)集對不同模型進行對比實驗,采用準確率、召回率與F1值作為評價指標,實驗結(jié)果表明,Transformer模型相比較于其他模型,在中文文本自動校對的性能上有了大幅提升。

摘要:圖像分類是根據(jù)圖像的信息將不同類別的圖像區(qū)分開來,是計算機視覺中重要的基本問題,也是圖像檢測、圖像分割、物體跟蹤、行為分析等其他高層視覺任務的基礎。深度學習是機器學習研究中的一個新的領域,其動機在于建立、模擬人腦進行分析學習的神經(jīng)網(wǎng)絡,它模仿人腦的機制來解釋數(shù)據(jù),例如圖像、聲音和文本。該系統(tǒng)基于Caffe深度學習框架,首先對數(shù)據(jù)集進行訓練分析構(gòu)建深度學習網(wǎng)絡,提取數(shù)據(jù)集圖像特征信息,得到數(shù)據(jù)對應的分類模型,然后以bvlc-imagenet訓練集模型為基礎,對目標圖像進行擴展應用,實現(xiàn)“以圖搜圖”Web應用。

摘要:為建設國家電網(wǎng)客戶服務中心的智能對話系統(tǒng),需要從大量文檔、知識庫、對話等數(shù)據(jù)中提煉知識形成知識圖譜,提出一種融合事實圖譜和事理圖譜的新型知識圖譜框架,能夠基于多源異構(gòu)數(shù)據(jù)共建新型知識圖譜,在國網(wǎng)領域精準問答、客服系統(tǒng)知識支撐、對話管理引導、知識推理等方面均有較好性能。融合后的圖譜及應用系統(tǒng)在國網(wǎng)客服中心問答平臺中投入使用,大幅提升了客服人員工作效率和服務質(zhì)量。

摘要:針對目前齒輪箱系統(tǒng)在利用神經(jīng)網(wǎng)絡故障診斷時存在正確識別率低和依靠經(jīng)驗選擇參數(shù)的問題,提出了基于粒子群優(yōu)化BP網(wǎng)絡的齒輪箱故障診斷方法。簡要介紹利用齒輪振動原理提取特征參數(shù)建立故障模型,該模型以齒輪箱特征向量為輸入、故障類型為輸出,詳細分析了通過BP神經(jīng)網(wǎng)絡、概率神經(jīng)網(wǎng)絡和粒子群優(yōu)化BP神經(jīng)網(wǎng)絡實現(xiàn)齒輪箱故障診斷。仿真結(jié)果表明,BP神經(jīng)網(wǎng)絡對齒輪箱故障診斷收斂速度慢,故障識別率為82%;概率神經(jīng)網(wǎng)絡的模型故障診斷識別率依據(jù)經(jīng)驗選取spread值決定,故障識別率最大為98%;粒子群優(yōu)化后的BP神經(jīng)網(wǎng)絡故障診斷分類識別率為100%且自適應能力強。

摘要:探討卷積神經(jīng)網(wǎng)絡(Convonlutional Neural Network,CNN)在肝包蟲病CT圖像診斷中的應用。選取兩種類型的肝包蟲病CT圖像進行歸一化、改進的中值濾波去噪和數(shù)據(jù)增強等預處理。以LeNet-5模型為基礎提出改進的CNN模型CTLeNet,采用正則化策略減少過擬合問題,加入Dropout層減少參數(shù)個數(shù),對二分類肝包蟲圖像進行分類實驗,同時通過反卷積實現(xiàn)特征可視化,挖掘疾病潛在特征。結(jié)果表明,CTLeNet模型在分類任務中取得了較好的效果,有望通過深度學習方法對肝包蟲病提供輔助診斷和決策支持。

摘要:設計并實現(xiàn)了NVIDIA嵌入式平臺Jetson TX2上的車輛跟蹤系統(tǒng)。從攝像頭采集YUV420格式的視頻數(shù)據(jù),然后將數(shù)據(jù)送到Tegra Parker硬件HEVC編碼器進行編碼,輸出碼流經(jīng)過RTP封裝后通過UDP廣播發(fā)送,利用Gstreamer多媒體框架開發(fā)接收及解碼程序,最后,針對獲取的視頻動態(tài)進行車輛的跟蹤與顯示。運行Yolo V2檢測算法,對車輛進行檢測,從而為跟蹤系統(tǒng)提供跟蹤對象。利用Kalman濾波算法對車輛的位置進行預測,再經(jīng)過Meanshift算法進行車輛跟蹤。系統(tǒng)能夠?qū)崿F(xiàn)幀率為60 f/s的超高清4K視頻實時編碼和傳輸,此系統(tǒng)中的HEVC 硬件編碼器編碼速率比PC端x265編碼器大3個數(shù)量級,PSNR比PC端x265編碼器高6 dB,更加適用于智能交通中。

摘要:神經(jīng)網(wǎng)絡的存儲能力一直是一個重大的缺陷,其存儲主要體現(xiàn)在權(quán)重系數(shù)上,因此參數(shù)量一多,訓練起來就十分困難。給神經(jīng)網(wǎng)絡設計一個外部關聯(lián)存儲器,能有效對神經(jīng)網(wǎng)絡的輸入進行關聯(lián)查詢,并將查詢的結(jié)果作為輔助輸入傳入到神經(jīng)網(wǎng)絡中去。此外,設計了自然語言語句的向量嵌入模型,并將模型和關聯(lián)存儲器集合起來形成一個自動關聯(lián)語句語義向量的關聯(lián)存儲系統(tǒng),其性能指標達到了設計要求。

摘要:針對視頻序列中運動目標跟蹤過程中可能出現(xiàn)的目標旋轉(zhuǎn)、遮擋、形變等原因造成的跟蹤失敗問題,提出了一種基于目標多區(qū)域分割的跟蹤方法。主要通過將目標劃分為多個部分相互重疊的區(qū)域,然后選擇跟蹤過程中相對穩(wěn)定的多個區(qū)域進行定位,進而對跟蹤的目標采用不同目標區(qū)域權(quán)重更新不同的模板更新策略,這樣選擇主要可以增加算法的抗遮擋、抗旋轉(zhuǎn)能力。實驗結(jié)果表明,該方法對目標遮擋、旋轉(zhuǎn)等具有一定的適應能力。

摘要:對絕緣柵雙極型晶體管進行參數(shù)預測可以有效地避免因其失效帶來的經(jīng)濟損失和安全問題。對絕緣柵雙極型晶體管參數(shù)進行分析,設計了一個基于LSTM網(wǎng)絡的絕緣柵雙極型晶體管參數(shù)預測SoC硬件系統(tǒng)。該系統(tǒng)使用ARM處理器作為總控制器,控制各個子模塊的調(diào)用和數(shù)據(jù)的傳輸,F(xiàn)PGA內(nèi)通過對矩陣向量內(nèi)積算法進行優(yōu)化提高LSTM網(wǎng)絡內(nèi)部的數(shù)據(jù)運算速度,并且采用多項式近似的方法降低了激活函數(shù)所占用的資源。實驗結(jié)果表明,系統(tǒng)的預測平均準確率為92.6%,計算速度相比于CPU快了3.74倍,同時具有低功耗的特點。

摘要:近年來卷積神經(jīng)網(wǎng)絡和循環(huán)神經(jīng)網(wǎng)絡在文本分類領域得到了越來越廣泛的的應用。提出一種卷積神經(jīng)網(wǎng)絡和長短時記憶網(wǎng)絡特征融合的模型,通過長短期記憶網(wǎng)絡作為池化層的替代來獲得長期依賴性,從而構(gòu)建一個聯(lián)合CNN和RNN的框架來克服單卷積神經(jīng)網(wǎng)絡忽略詞語在上下文中語義和語法信息的問題。所提出的方法在減少參數(shù)數(shù)量和兼顧文本序列全局特征方面起著重要作用,實驗結(jié)果表明,可以通過更小的框架來實現(xiàn)相同級別的分類性能,并且在準確率方面超越了同類型的其他幾種方法。

摘要:使用財務數(shù)據(jù)構(gòu)建一個多因子選股模型,在支持向量機分類上進行預測優(yōu)化。選股上使用排序法對數(shù)據(jù)進行預處理,再使用支持向量機對股票收益進行分類預測,最后使用數(shù)據(jù)到分離超平面的距離進行排序,優(yōu)化支持向量機的分類預測。實證中,從中證500成分股中選出股票組合,在2016年四季度到2018年一季度獲得累計收益88.96%。擇時策略的均線策略和通道突破策略均能有效降低波動率和回撤。還使用高頻數(shù)據(jù)來降低均線策略的滯后性,波動率又得到進一步降低。本模型利用支持向量機性質(zhì)提高預測精度,結(jié)合技術(shù)分析優(yōu)化了策略的收益,為多因子選股和交易提供了新的研究視角。

摘要:在當前人工智能技術(shù)發(fā)展的熱潮中,對話系統(tǒng)已經(jīng)越來越實用化。與一般的閑聊對話系統(tǒng)不同,特定領域的對話系統(tǒng)是基于知識,帶有上下文推理的實用性對話系統(tǒng)。保險領域是典型的特定領域,介紹了一種保險相關領域?qū)υ捪到y(tǒng)的基本構(gòu)建方法,可以幫助用戶快速、實用地在某特定領域和場景下構(gòu)建對話系統(tǒng),且具有一定的推廣性和拓展性。

摘要:身份認證技術(shù)有了很大的發(fā)展,隨之不斷出現(xiàn)的是各種偽造合法用戶信息的欺詐手段。針對這一問題,提出一種基于深度學習人臉活體檢測算法,分析了真實人臉和欺詐人臉之間的區(qū)別,將真實人臉和照片進行數(shù)據(jù)去中心化、zca白化去噪聲、隨機旋轉(zhuǎn)等處理;同時,利用卷積神經(jīng)網(wǎng)絡對照片的面部特征進行提取,提取出來的特征送入神經(jīng)網(wǎng)絡訓練、分類。算法在公開的數(shù)據(jù)庫NUAA上進行了驗證,實驗結(jié)果表明該方法降低了計算的復雜度,提高了識別準確率。

摘要:針對當前深度學習目標檢測算法計算復雜度高和內(nèi)存需求大等問題,設計并實現(xiàn)了一種基于FPGA的深度學習目標檢測系統(tǒng)。設計對應YOLOv2-Tiny目標檢測算法的硬件加速器,對加速器各模塊的處理時延建模,給出卷積計算模塊的詳細設計。實驗結(jié)果表明,與CPU相比,CPU+FPGA的異構(gòu)系統(tǒng)是雙核ARM-A9能效的67.5倍,Xeon的94.6倍;速度是雙核ARM-A9的84.4倍,Xeon的5.5倍左右。并且,當前設計在性能上超過之前的工作。

摘要:針對車站、商場等大型場所中客流量大、背景復雜等原因?qū)е露喑叨热四槞z測精度低的問題,建立了一種基于RefineDet多層特征圖融合的多尺度人臉檢測方法。首先利用第一級網(wǎng)絡進行特征提取并在不同尺度的特征圖上粗略預估人臉位置;然后在第二級中通過特征金字塔網(wǎng)絡將低層特征與高層特征融合,進一步增強小尺寸人臉的語義信息;最后,通過置信度和焦點損失函數(shù)對檢測框進行二次抑制,達到邊框的精確回歸。實驗中將人臉候選區(qū)域的寬高比只設置為1:1,以此來降低運算量并提高人臉檢測精度。在Wider Face數(shù)據(jù)集上的實驗結(jié)果表明,該方法能有效檢測不同尺度的人臉,在Easy、Medium、Hard 3個子數(shù)據(jù)集上測試結(jié)果分別為93.4%、92%、84.4%的MAP,尤其對小尺寸人臉的檢測精度有明顯提高。

摘要:多示例多標簽學習框架是一種針對解決多義性問題而提出的新型機器學習框架,在多示例多標簽學習框架中,一個對象是用一組示例集合來表示,并且和一組類別標簽相關聯(lián)。E-MIMLSVM+算法是多示例多標簽學習框架中利用退化思想的經(jīng)典分類算法,針對其無法利用無標簽樣本進行學習從而造成泛化能力差等問題,使用半監(jiān)督支持向量機對該算法進行改進。改進后的算法可以利用少量有標簽樣本和大量沒有標簽的樣本進行學習,有助于發(fā)現(xiàn)樣本集內(nèi)部隱藏的結(jié)構(gòu)信息,了解樣本集的真實分布情況。通過對比實驗可以看出,改進后的算法有效提高了分類器的泛化性能。

摘要:時間序列預測是數(shù)據(jù)中心關鍵性能指標異常檢測的重要環(huán)節(jié)。針對時間序列,利用小波基函數(shù)作為隱含層節(jié)點傳遞函數(shù)來構(gòu)造小波神經(jīng)網(wǎng)絡進行預測;同時選取動量梯度下降法提高神經(jīng)網(wǎng)絡學習效率;再根據(jù)粒子群算法訓練得到最優(yōu)解作為神經(jīng)網(wǎng)絡參數(shù)初始值;最后使用MATLAB進行仿真,以較高準確性對關鍵性能指標時間序列進行了預測。

摘要:長期以來,各類交通事故嚴重影響了人們生命財產(chǎn)安全和社會經(jīng)濟發(fā)展。交通事故分析是對交通事故資料進行調(diào)查研究,發(fā)現(xiàn)事故動向和各種影響因素對事故總體的作用和相互關系,以便定量地認識事故現(xiàn)象的本質(zhì)和內(nèi)在規(guī)律。通過對交通事故中記錄駕駛員違法行為的文本數(shù)據(jù)進行分析,提出了一種文本主題提取模型和技術(shù),來挖掘交通事故中駕駛員風險駕駛因素,解決以往交通事故統(tǒng)計中交通違法行為難以挖掘的問題,計算出影響交通事故的最大支配因素。最后以北京地區(qū)一般程序處理的交通事故為例,結(jié)合北京市交通管理專家經(jīng)驗,驗證該模型可應用于交通事故中違法行為的主題提取,結(jié)論與長期治理經(jīng)驗相吻合。

摘要:針對圖像質(zhì)量客觀評價方法在實際應用場景下性能退化的問題,將人眼視覺特性融入圖像特征處理的多個環(huán)節(jié),提出一種融合視覺結(jié)構(gòu)顯著和視覺能量顯著特征互補的方法。首先,根據(jù)人眼特性對圖像的灰度能量、對比度能量和梯度結(jié)構(gòu)三層互補特征進行空域-頻域聯(lián)合變換處理;其次,分別提取前述三層視覺特征的多通道信息并進行評價;最后,基于視覺特性和圖像失真度將各層視覺特征評價從內(nèi)層至外層逐步自適應綜合。實驗表明,本方法具有較高的水平和更好的穩(wěn)定性,提高了實際應用場景下的評價性能。

摘要:為了驗證股票的價格運動與過去應該是相似的這一假設,運用K近鄰算法,將價格運動簡單劃分為漲跌兩類進行預測,進行假設驗證。使用滑窗方法比較現(xiàn)在的價格運動與何時的歷史價格更為相似,將多個K近鄰模型組合成集成模型,實現(xiàn)模型的泛化和策略收益的調(diào)整。使用中證500指數(shù)的歷史價格數(shù)據(jù)進行預測實證,2017年~2018年9月的預測結(jié)果顯示單個K近鄰模型策略獲得76.72%的收益,現(xiàn)在的價格運動與遙遠的過去更為相似,集成模型能更好地控制風險。該模型利用K近鄰模型的含義驗證了股票價格運動具有相似性,可以作為證券交易的擇時策略。

摘要:人臉識別技術(shù)是深度學習的重要研究領域。為了克服傳統(tǒng)開環(huán)人臉認知模式以及深層神經(jīng)網(wǎng)絡結(jié)構(gòu)的缺陷,模仿人類實時評測認知結(jié)果自尋優(yōu)調(diào)節(jié)特征空間和分類認知準則的認知模式,借鑒閉環(huán)控制理論思想,探索了一種基于深度集成學習的人臉智能反饋認知方法。首先,基于DEEPID網(wǎng)絡建立人臉圖像由全局到局部具有確定映射關系的非結(jié)構(gòu)化特征空間;其次,基于特征可分性評測和變精度粗糙集理論,從信息論角度建立非結(jié)構(gòu)化動態(tài)特征表征的人臉認知決策信息系統(tǒng)模型,以約減非結(jié)構(gòu)化特征空間;再次,采用集成隨機權(quán)向量函數(shù)連接網(wǎng)絡,構(gòu)建簡約非結(jié)構(gòu)化特征空間的分類認知準則;最后,構(gòu)建人臉認知結(jié)果熵測度指標,為人臉特征空間和分類認知準則的自尋優(yōu)調(diào)節(jié)機制提供量化依據(jù)。實驗結(jié)果表明,較已有方法,該方法有效地提高了人臉圖像的識別率。

摘要:隨著計算機技術(shù)的發(fā)展,融合計算機視覺、機器學習、深度學習等技術(shù)的火災圖像處理技術(shù)得到了廣泛的研究和應用。針對傳統(tǒng)圖像處理方法預處理過程復雜且誤報率高等問題,提出一種基于深度卷積神經(jīng)網(wǎng)絡模型進行火災檢測的方法,其減少了復雜的預處理環(huán)節(jié),將整個火災識別過程整合成一個單深度神經(jīng)網(wǎng)絡,便于訓練與優(yōu)化。針對識別過程中類似火災場景對火災檢測產(chǎn)生干擾的問題,利用火災的運動特性,創(chuàng)新性地提出利用火災視頻前后幀火災坐標位置變化來排除燈光等類似火災場景對檢測的干擾。對比了眾多深度學習開源框架后,選擇Caffe框架進行訓練及測試,實驗結(jié)果表明,該方法實現(xiàn)了對火災圖像的識別和定位,適應于不同的火災場景,具有很好的泛化能力和抗干擾能力。

摘要:針對在進近著陸的過程中,儀表著陸系統(tǒng)(ILS)易受到外界環(huán)境及空域的干擾,導致導航精度降低的問題,提出一種利用慣性導航系統(tǒng)(INS)與GBAS著陸系統(tǒng)(GLS)進行改進的組合導航算法,將組合導航系統(tǒng)輸出位置信息之間的差值作為BP神經(jīng)網(wǎng)絡改進的無跡卡爾曼濾波器(UKF)的量測值,通過最優(yōu)加權(quán)的方法得到系統(tǒng)的全局最優(yōu)估計值。相比于傳統(tǒng)的聯(lián)邦濾波算法,該算法能有效降低測量噪聲,減小飛機進近著陸時的誤差,提高導航精度。

摘要:隨著互聯(lián)網(wǎng)應用的飛速發(fā)展和用戶人數(shù)的急劇增長,股市評論與觀點在很大程度上反映了股市行情,也影響著股市漲跌。因此,如何快速高效地分析到網(wǎng)民對股市的態(tài)度和觀點,對股市預測具有很大指導意義。論文研究通過分析不同專業(yè)人士發(fā)布股評的情感極性來預測股票上漲與下跌趨勢。提出了一種綜合金融詞組詞典和結(jié)尾段加權(quán)的情感分析方法,能解決情感字典分析方法對領域依賴性問題,有效地提高了情感分析準確度。另外,論文還提出了一種加窗的股票預測模型,可用于分析預測事件窗口的最佳值。實驗結(jié)果表明,基于股評情感分析來預測特定股票上漲或下跌趨勢具有較好效果。

摘要:基于特征提取和模式識別的多體制通信信號自動調(diào)制識別技術(shù)是軟件無線電領域中的重要研究課題,是復雜電磁環(huán)境下頻譜管理、頻譜檢測等非協(xié)作通信領域的關鍵技術(shù)之一。提出一種基于深度學習的通信信號調(diào)制模式識別算法,應用自編碼技術(shù)進行特征提取,獲得具有較好的抗干擾能力的特征集,然后使用 BP神經(jīng)網(wǎng)絡對經(jīng)過篩選的特征進行分類識別,實現(xiàn)了MQAM通信信號調(diào)制模式自動識別。仿真實驗結(jié)果表明,所提出的方法分類識別效果好,有效提高了數(shù)字調(diào)制信號自動識別的抗干擾能力。

摘要:針對國網(wǎng)客服電話語音識別在特定領域核心詞識別效果差的問題,提出一種基于HCLG領域詞權(quán)重增強和領域詞糾正的方法,能夠?qū)崟r并快速地添加領域詞,從而動態(tài)地優(yōu)化語言模型,提升語音識別效果。將該模型和算法優(yōu)化應用在國網(wǎng)客服中心電話語音的咨詢、維修、投訴等各種領域場景中,其語音識別結(jié)果都得到大幅改善。

摘要:4G網(wǎng)絡技術(shù)的成熟使得用戶對運營商的業(yè)務需求越來越高,如何維系用戶和通過對用戶屬性的研究來迎合用戶對業(yè)務的需求,建立方便快捷的體驗服務手段,建設維系挽留系統(tǒng)是我國通信運營商未來發(fā)展的重中之重。首先分析移動用戶維系發(fā)展現(xiàn)狀,提出用戶維系發(fā)展屬性。其次,采用數(shù)據(jù)挖掘方法建立以用戶穩(wěn)定度和用戶價值評價為基礎的數(shù)據(jù)挖掘分析模型,并通過用戶數(shù)據(jù)進行驗證。最后,針對存量維系如何進行多渠道精準推送提出進一步展望。

摘要:由于圖像中的雨線條紋具有不同形狀、尺寸且分布不均勻,單一神經(jīng)網(wǎng)絡學習分布不均勻的雨密度能力弱,去雨效果不顯著,對此提出雨密度感知引導擴張網(wǎng)絡對單張圖片去除雨的方法。網(wǎng)絡分為兩部分:(1)雨密度感知網(wǎng)絡對不同密度雨的圖片進行分類(大雨、中雨、小雨);(2)聯(lián)合雨密度感知分類信息引導擴張網(wǎng)絡學習不同的雨密度特征細節(jié),用于檢測雨線和去雨。實驗證明了該方法在合成和真實數(shù)據(jù)集上去雨的有效性。

摘要:深度神經(jīng)網(wǎng)絡由于結(jié)構(gòu)類似于生物神經(jīng)網(wǎng)絡,因此擁有高效、精準抽取信息深層隱含特征的能力和能夠?qū)W習多層的抽象特征表示,且能夠?qū)缬?、多源、異質(zhì)的內(nèi)容信息進行學習等優(yōu)勢。提出了一種基于多用戶-項目結(jié)合深度神經(jīng)網(wǎng)絡抽取特征、自學習等優(yōu)勢實現(xiàn)信息個性化推薦的模型,該模型通過對輸入多源異構(gòu)數(shù)據(jù)特征進行深度神經(jīng)網(wǎng)絡學習、抽取,再融合協(xié)同過濾中的廣泛個性化產(chǎn)生候選集,然后通過二次模型學習產(chǎn)生排序集,實現(xiàn)精準、實時、個性化推薦。通過真實數(shù)據(jù)集對模型評估實驗,實驗結(jié)果表明,該模型能夠很好地學習、抽取用戶隱特征,并且能夠一定程度上解決傳統(tǒng)推薦系統(tǒng)稀疏性、新物品等問題,同時實現(xiàn)了更加精準、實時、個性化的推薦。

摘要:以移動機器人視覺導航為應用背景,針對傳統(tǒng)ORB算法在視覺SLAM中存在特征點分布不均勻、重疊特征點較多的問題,提出一種改進ORB算法。首先,對每層圖像的尺度空間金字塔進行網(wǎng)格劃分,增加空間尺度信息;其次,在特征點檢測時,采用改進FAST角點自適應閾值提取,設置感興趣區(qū)域;然后,采用非極大值抑制的方法,抑制低閾值特征點的輸出;最后,使用基于區(qū)域圖像特征點分布的方差數(shù)值評價待檢測圖像中特征點的分布情況。實驗結(jié)果表明,改進ORB算法特征點的分布較為均勻,輸出特征點重疊數(shù)量較少,執(zhí)行時間較短。

摘要:針對單獨機器人難以執(zhí)行復雜環(huán)境中任務的問題,Unmanned Air/Ground Vehicle(UAV/UGV)協(xié)同系統(tǒng)近年來受到了廣泛關注。為了提高執(zhí)行任務的工作效率,提出一種基于視覺傳感器下UAV/UGV協(xié)同系統(tǒng)中UAV目標識別下UGV全局路徑規(guī)劃的方法,無人機利用高空視野優(yōu)勢獲取目標物與環(huán)境信息, SURF算法和圖像分割實現(xiàn)環(huán)境建模。無人車根據(jù)無人機獲取的信息,利用優(yōu)化的A*算法完成全局路徑規(guī)劃,并且在典型搜救場景中進行了仿真驗證。實驗表明,SURF算法能滿足目標識別的精確度、實時性和魯棒性;并且利用優(yōu)化的A*算法實現(xiàn)了UGV快速準確的全局路徑規(guī)劃。

摘要:圖像著色的目標是為灰度圖像的每一個像素分配顏色,它是圖像處理領域的熱點問題。以U-Net為主線網(wǎng)絡,結(jié)合深度學習和卷積神經(jīng)網(wǎng)絡設計了一個全自動的著色網(wǎng)絡模型。在該模型中,支線使用卷積神經(jīng)網(wǎng)絡SE-Inception-ResNet-v2作為高水平的特征提取器,提取圖像的全局信息,同時在網(wǎng)絡中使用PoLU(Power Linear Unit)函數(shù)替代線性整流函數(shù)(ReLU)。實驗結(jié)果證明此著色網(wǎng)絡模型能夠?qū)叶葓D像進行有效的著色。

摘要:針對卷積神經(jīng)網(wǎng)絡(CNN)中空間上的指靜脈信息丟失的問題,提出了一種基于膠囊網(wǎng)絡(Capsule Network,CapsNets)的指靜脈識別算法。CapsNets在整個學習過程中以“膠囊”的形式從底層傳遞至高層,如此以向量的形式封裝指靜脈的多維特征,特征會在網(wǎng)絡中被保存,而不是丟失后進行恢復。采用60 000張圖像作為訓練集,10 000張圖為測試集,通過對圖像增強、裁剪后進行網(wǎng)絡學習。通過實驗表明,CapsNets的網(wǎng)絡結(jié)構(gòu)特征相比CNN在處理脊線區(qū)域時效果更加明顯,對比VGG精確度增加了13.6%,loss值也收斂到0.01。

摘要:設計了一種基于深度學習的實時識別硬件系統(tǒng)框架。該系統(tǒng)框架使用Keras完成卷積神經(jīng)網(wǎng)絡模型的訓練并提取出網(wǎng)絡的參數(shù),利用ZYNQ器件的FPGA+ARM軟硬件協(xié)同的方式,使用ARM完成對實時圖像數(shù)據(jù)的采集、預處理及顯示,通過FPGA實現(xiàn)卷積神經(jīng)網(wǎng)絡的硬化并對圖像進行識別,再將識別結(jié)果發(fā)送至上位機進行實時顯示。系統(tǒng)框架采用MNIST和Fashion MNIST數(shù)據(jù)集作為網(wǎng)絡模型硬化試驗樣本,實驗結(jié)果表明,在一般場景下該系統(tǒng)框架能夠?qū)崟r、準確地完成圖像數(shù)據(jù)的獲取、顯示及識別,并且具有可移植性高、處理速度快、功耗低的特點。

摘要:手寫體數(shù)字的識別是人工智能識別系統(tǒng)中的重要組成部分。因個體手寫數(shù)字的差異,現(xiàn)有識別系統(tǒng)準確率較低。基于TensorFlow深度學習框架完成手寫體數(shù)字的識別及應用,首先建立TensorFlow深度學習框架,并分析了Softmax、卷積神經(jīng)網(wǎng)絡(CNN)模型結(jié)構(gòu),再對手寫體數(shù)據(jù)集MNIST的60 000個樣本進行深度學習,然后進行10 000個樣本的測試對比,最后移植最優(yōu)模型到Android平臺進行應用。實測數(shù)據(jù)驗證,相對于傳統(tǒng)的Softmax模型,基于TensorFlow深度學習CNN模型識別率高達99.17%,提升了7.6%,為人工智能識別系統(tǒng)的發(fā)展提供了一定的科研價值。

摘要:為改善人體行為識別任務中準確率低的問題,提出了一種基于批歸一化的卷積神經(jīng)網(wǎng)絡(CNN)與長短期記憶(LSTM)神經(jīng)網(wǎng)絡結(jié)合的神經(jīng)網(wǎng)絡。CNN部分引入批歸一化思想,將輸入網(wǎng)絡的訓練樣本進行小批量歸一化處理,經(jīng)過全連接之后,送入長短期記憶神經(jīng)網(wǎng)絡中。該算法采用時空雙流網(wǎng)絡模型結(jié)構(gòu),視頻數(shù)據(jù)的RGB圖像作為空間流網(wǎng)絡輸入,光流場圖像作為時間流網(wǎng)絡輸入,再將時空雙流網(wǎng)絡各自得到的識別結(jié)果進行加權(quán)融合得到最終的行為識別結(jié)果。實驗結(jié)果表明,本文設計的時空雙流神經(jīng)網(wǎng)絡算法在人體行為識別任務上具有較高的識別準確率。

摘要: 分析美國主流新聞媒體針對“一帶一路”倡議的關注熱點,研究相關輿情的情感傾向。用網(wǎng)絡爬蟲自動采集相關新聞,篩選高頻詞獲得媒體關注熱點。提出一種自動摘要-卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)的集成式模型進行文檔級情感分析。該模型首先提取摘要去除原始文檔中非重要數(shù)據(jù)的干擾,再利用卷積神經(jīng)網(wǎng)絡進行句子級情感分析,通過基于語義指向的方法獲得文檔級的情感分數(shù),并對情感波動異常文章二次分析。在真實數(shù)據(jù)上的對比實驗表明,自動摘要-CNN的集成式文檔級情感分析模型在情感分析方面優(yōu)于單一CNN的方法。

摘要: 為改善人體行為識別任務中準確率低的問題,提出了一種基于批歸一化的卷積神經(jīng)網(wǎng)絡(CNN)與長短期記憶(LSTM)神經(jīng)網(wǎng)絡結(jié)合的神經(jīng)網(wǎng)絡。CNN部分引入批歸一化思想,將輸入網(wǎng)絡的訓練樣本進行小批量歸一化處理,經(jīng)過全連接之后,送入長短期記憶神經(jīng)網(wǎng)絡中。該算法采用時空雙流網(wǎng)絡模型結(jié)構(gòu),視頻數(shù)據(jù)的RGB圖像作為空間流網(wǎng)絡輸入,光流場圖像作為時間流網(wǎng)絡輸入,再將時空雙流網(wǎng)絡各自得到的識別結(jié)果進行加權(quán)融合得到最終的行為識別結(jié)果。實驗結(jié)果表明,本文設計的時空雙流神經(jīng)網(wǎng)絡算法在人體行為識別任務上具有較高的識別準確率。

摘要: 手寫體數(shù)字的識別是人工智能識別系統(tǒng)中的重要組成部分。因個體手寫數(shù)字的差異,現(xiàn)有識別系統(tǒng)準確率較低?;赥ensorFlow深度學習框架完成手寫體數(shù)字的識別及應用,首先建立TensorFlow深度學習框架,并分析了Softmax、卷積神經(jīng)網(wǎng)絡(CNN)模型結(jié)構(gòu),再對手寫體數(shù)據(jù)集MNIST的60 000個樣本進行深度學習,然后進行10 000個樣本的測試對比,最后移植最優(yōu)模型到Android平臺進行應用。實測數(shù)據(jù)驗證,相對于傳統(tǒng)的Softmax模型,基于TensorFlow深度學習CNN模型識別率高達99.17%,提升了7.6%,為人工智能識別系統(tǒng)的發(fā)展提供了一定的科研價值。

摘要: 設計了一種基于深度學習的實時識別硬件系統(tǒng)框架。該系統(tǒng)框架使用Keras完成卷積神經(jīng)網(wǎng)絡模型的訓練并提取出網(wǎng)絡的參數(shù),利用ZYNQ器件的FPGA+ARM軟硬件協(xié)同的方式,使用ARM完成對實時圖像數(shù)據(jù)的采集、預處理及顯示,通過FPGA實現(xiàn)卷積神經(jīng)網(wǎng)絡的硬化并對圖像進行識別,再將識別結(jié)果發(fā)送至上位機進行實時顯示。系統(tǒng)框架采用MNIST和Fashion MNIST數(shù)據(jù)集作為網(wǎng)絡模型硬化試驗樣本,實驗結(jié)果表明,在一般場景下該系統(tǒng)框架能夠?qū)崟r、準確地完成圖像數(shù)據(jù)的獲取、顯示及識別,并且具有可移植性高、處理速度快、功耗低的特點。

摘要: 針對卷積神經(jīng)網(wǎng)絡(CNN)中空間上的指靜脈信息丟失的問題,提出了一種基于膠囊網(wǎng)絡(Capsule Network,CapsNets)的指靜脈識別算法。CapsNets在整個學習過程中以“膠囊”的形式從底層傳遞至高層,如此以向量的形式封裝指靜脈的多維特征,特征會在網(wǎng)絡中被保存,而不是丟失后進行恢復。采用60 000張圖像作為訓練集,10 000張圖為測試集,通過對圖像增強、裁剪后進行網(wǎng)絡學習。通過實驗表明,CapsNets的網(wǎng)絡結(jié)構(gòu)特征相比CNN在處理脊線區(qū)域時效果更加明顯,對比VGG精確度增加了13.6%,loss值也收斂到0.01。

摘要: 圖像著色的目標是為灰度圖像的每一個像素分配顏色,它是圖像處理領域的熱點問題。以U-Net為主線網(wǎng)絡,結(jié)合深度學習和卷積神經(jīng)網(wǎng)絡設計了一個全自動的著色網(wǎng)絡模型。在該模型中,支線使用卷積神經(jīng)網(wǎng)絡SE-Inception-ResNet-v2作為高水平的特征提取器,提取圖像的全局信息,同時在網(wǎng)絡中使用PoLU(Power Linear Unit)函數(shù)替代線性整流函數(shù)(ReLU)。實驗結(jié)果證明此著色網(wǎng)絡模型能夠?qū)叶葓D像進行有效的著色。

摘要: 針對目前深度學習中的卷積神經(jīng)網(wǎng)絡(CNN)在CPU平臺下訓練速度慢、耗時長的問題,采用現(xiàn)場可編程門陣列(FPGA)硬件平臺設計并實現(xiàn)了一種深度卷積神經(jīng)網(wǎng)絡系統(tǒng)。該系統(tǒng)采用修正線性單元(ReLU)作為特征輸出的激活函數(shù)并使用Softmax函數(shù)作為輸出分類器。利用流水線技術(shù)并針對每一層的特征運算進行了并行處理,從而能夠在1個系統(tǒng)時鐘周期內(nèi)完成整個CNN中的295次卷積運算。系統(tǒng)最后采用MNIST數(shù)據(jù)集作為實驗樣本,實驗結(jié)果表明,在50 MHz的工作頻率下,F(xiàn)PGA的訓練用時相較于通用CPU的訓練用時提升了8.7倍,經(jīng)過2 000次迭代后系統(tǒng)識別的準確率為92.42%。

摘要: 穴位的位置是否找準會直接影響治療效果,因此設計了一種基于粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(PSO-BP)的穴位相對坐標預測模型,然后與ARM結(jié)合構(gòu)成一個可以用于人體穴位定位的系統(tǒng)。首先采用PC進行MATLAB仿真訓練學習,然后將最優(yōu)權(quán)值及閾值保存下來并簡化算法嵌入ARM內(nèi),將在線預測轉(zhuǎn)變?yōu)殡x線過程。實驗結(jié)果表明:經(jīng)粒子群優(yōu)化過的BP神經(jīng)網(wǎng)絡有效地改善了局部極值缺陷,可應用于定位端預測穴位的位置,并在LCD中顯示穴位相關信息,控制端收到位置數(shù)據(jù)后可執(zhí)行電機上的運動操作。

摘要: 基于Google第二代人工智能學習系統(tǒng)TensorFlow構(gòu)建神經(jīng)網(wǎng)絡對煙霧圖像進行識別檢測,通過改進的運動檢測算法截取疑似煙霧區(qū)域圖像,并結(jié)合PCA降維算法和Inception Resnet v2網(wǎng)絡模型在TensorFlow平臺下進行煙霧特征的訓練識別。該算法實現(xiàn)了較大范圍的火災實時檢測報警,經(jīng)過實驗證明整個檢測過程準確地識別了視頻流中的煙霧區(qū)域,相比于傳統(tǒng)煙霧識別方法具有更高的準確率和自適應性,為大范圍的火災煙霧報警提供了一種有效方案。

摘要: 提出一種應用嵌入式技術(shù)和深度學習技術(shù)實現(xiàn)對胸部X光影像分析的設計方案。采用NIVIDIA公司生產(chǎn)的Jetson TX2作為核心板,配備以太網(wǎng)模塊、WiFi模塊等功能模塊搭建該分析系統(tǒng)的硬件平臺。在GPU服務器上利用MobileNets卷積神經(jīng)網(wǎng)絡對標注的胸部X光影像數(shù)據(jù)集進行訓練,將訓練好的神經(jīng)網(wǎng)絡模型移植到Jetson TX2核心板,在嵌入式平臺下完成對胸腔積液、浸潤、肺氣腫、氣胸以及肺不張癥狀的檢測。利用美國國立衛(wèi)生研究院提供的胸部X光影像數(shù)據(jù)進行測試,通過實驗證明,該方法在識別準確率上優(yōu)于其他的檢測方法,同時識別所需時間比其他方法短。

摘要: 提出了一種用于圖像分類的卷積神經(jīng)網(wǎng)絡,將不同池化方式對圖像分類的影響進行了分析對比,采用重疊池化和dropout技術(shù),較好地解決過擬合問題。與傳統(tǒng)神經(jīng)網(wǎng)絡相比,該方法在CIFAR-10數(shù)據(jù)集上獲得了較好的結(jié)果,在測試集上準確率比訓練集上準確率高9%左右。

摘要: 提出一種基于機器視覺的智能導盲眼鏡系統(tǒng)的設計方案。采用三星公司Cortex-A8架構(gòu)的 S5PV210作為中央處理器,搭載Linux系統(tǒng),配備雙目采集、GPS定位、語音播報、GSM短信、語音通話、無線傳輸六大核心功能模塊搭建智能導盲眼鏡系統(tǒng)的硬件平臺,結(jié)合深度學習算法在遠程云服務器上完成了對目標場景的智能識別,最后以語音的形式實時對盲人的行走作出準確引導。系統(tǒng)測試結(jié)果表明,該智能導盲眼鏡系統(tǒng)在測試環(huán)境下不僅能對盲人出行正確導航,還具有一定的目標識別能力,能幫助盲人進行簡易物品歸類。該系統(tǒng)還兼有GPS定位、語音通話、GSM短信等多項輔助功能。

摘要: 無人機的廣泛運用,在給人們帶來便利的同時,也引發(fā)了不良影響。比如,無人機飛入禁飛區(qū)引發(fā)安全問題,由于不正當?shù)氖褂们址腹竦碾[私等,因此需要構(gòu)建一個無人機警察系統(tǒng),對無人機實施監(jiān)控,遏制亂飛現(xiàn)象。采用傳統(tǒng)的識別方法,靈活性不足,精度也不夠高。為此提出一種基于深度學習的無人機識別算法,通過訓練一個基于卷積神經(jīng)網(wǎng)絡(CNNs)的學習網(wǎng)絡,得出一個高效的識別模型,實現(xiàn)無人機和非無人機間的分類。模型的測試結(jié)果表明,該方法具有較高的識別率。

摘要: 現(xiàn)有生產(chǎn)線工業(yè)機器人抓取點固定,工件只能以固定的姿態(tài)提前擺放在固定的位置,這種裝配模式很難滿足復雜的工業(yè)生產(chǎn)要求且效率低下。設計了基于視覺引導的機器人裝配系統(tǒng)改進原有系統(tǒng)。設計了機器視覺系統(tǒng),實現(xiàn)了工件的快速識別、定位以及姿態(tài)確定功能;設計了抓放系統(tǒng),實現(xiàn)了工件的精確抓取和安裝功能;采用Visual Studio的MFC開發(fā),實現(xiàn)圖像處理算法,并利用Socket通信將坐標和姿態(tài)數(shù)據(jù)發(fā)送給機器人。通過實驗驗證本系統(tǒng)具有良好的穩(wěn)定性和快速性,可以滿足生產(chǎn)的要求,大幅提高生產(chǎn)效率。