《電子技術(shù)應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 用于主動學習的時序特征融合預測損失網(wǎng)絡
用于主動學習的時序特征融合預測損失網(wǎng)絡
電子技術(shù)應用
王繹翔
寧波大學 信息科學與工程學院
摘要: 通過主動學習模型來選取最有價值的數(shù)據(jù)點進行標注是深度學習減少標注數(shù)據(jù)量的一種方式。預測損失模型是一類與任務無關(guān)的主動學習模型,該類模型在多個任務中都有不錯的表現(xiàn)。但是這類模型均不是端到端的模型,不斷變化的輸入特征會導致?lián)p失預測網(wǎng)絡在訓練時出現(xiàn)輸入偏差。提出了時序特征融合預測損失模型用于解決該模型的輸入偏差問題。實驗證明,提出的算法在各個任務中的性能與以往最先進的算法相比,平均提升約1.5%,與原預測損失模型相比,平均提升5%。
中圖分類號:TP391 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.234772
中文引用格式: 王繹翔. 用于主動學習的時序特征融合預測損失網(wǎng)絡[J]. 電子技術(shù)應用,2024,50(6):10-17.
英文引用格式: Wang Yixiang. Temporal feature fusion learning loss model for active learning[J]. Application of Electronic Technique,2024,50(6):10-17.
Temporal feature fusion learning loss model for active learning
Wang Yixiang
School of Information Science and Engineering, Ningbo University
Abstract: Using active learning models to select the most valuable data points for annotation is one way that deep learning reduces the amount of labeled data required. Prediction loss models are a type of task-agnostic active learning models that perform well across multiple tasks. However, these models are not end-to-end models, and changing input features can lead to input bias during the training of the loss prediction network. This paper proposes a temporal feature fusion prediction loss model to address the issue of input bias in such models. Experiments demonstrate that the method proposed in this paper achieves an average performance improvement of approximately 1.5% across various tasks compared to previous state-of-the-art methods, and an average improvement of 5% compared to the original prediction loss model.
Key words : active learning;deep learning;learning loss;time series

引言

近年來,深度網(wǎng)絡在多個任務中取得了許多突破性進展[1]。但是,深度網(wǎng)絡的訓練需要大量的標注數(shù)據(jù),在很多任務中,標注數(shù)據(jù)的獲取需要專家進行標注,成本很高。

主動學習是一種可行的用于減少模型對標注數(shù)據(jù)量依賴的方法。主動學習模型主要由3個部分組成,即目標任務模塊、主動學習模塊和標注模塊。目標任務模塊用于在現(xiàn)有的標注數(shù)據(jù)集上訓練用于目標任務(分類、分割等)的模型。主動學習模塊通過主動學習的選擇算法來選擇合適的樣本用于標注。注釋模塊主要根據(jù)主動學習模塊選擇的樣本為其打上標簽并放入標注數(shù)據(jù)集中用于下一輪訓練。在一般的任務中,注釋模塊由專家來完成,專家為選擇的樣本標注后加入到標注數(shù)據(jù)集中。因此,設計主動學習的選擇算法是主動學習的核心任務。

現(xiàn)有的選擇算法主要有三類,即基于樣本的不確定性的算法、基于樣本的多樣性的算法以及不確定性和多樣性結(jié)合的算法。其中,早期的選擇算法在文獻[2]中進行描述?;跇颖镜牟淮_定性的算法選擇對于任務模型而言預測最不確定的數(shù)據(jù)交給專家進行標注[3-4]?;跇颖镜亩鄻有缘乃惴▌t選擇最具有多樣性或代表性的數(shù)據(jù)交給專家進行標注[5-6]。不確定性和多樣性結(jié)合的算法則綜合以上兩點來對樣本進行評估和選擇[7]。

目前的主動學習模型主要有任務依賴的模型和任務不可知的模型兩類。大多數(shù)主動學習模型屬于任務依賴型主動學習模型[8]。針對某項特定的目標任務進行選擇算法的設計,這些算法往往只能適用于某項特定任務,可擴展性和任務泛化性較差。近年來,許多與任務無關(guān)的主動學習模型被提出并用于各個任務中,這類模型在多類任務中都有很好的效果。


本文詳細內(nèi)容請下載:

http://ihrv.cn/resource/share/2000006022


作者信息:

王繹翔

(寧波大學 信息科學與工程學院, 浙江 寧波 355211)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。