123,123

用于主动学习的时序特征融合预测损失网络

电子技术应用

王绎翔

宁波大学信息科学与工程学院

摘要： 通过主动学习模型来选取最有价值的数据点进行标注是深度学习减少标注数据量的一种方式。预测损失模型是一类与任务无关的主动学习模型，该类模型在多个任务中都有不错的表现。但是这类模型均不是端到端的模型，不断变化的输入特征会导致损失预测网络在训练时出现输入偏差。提出了时序特征融合预测损失模型用于解决该模型的输入偏差问题。实验证明，提出的算法在各个任务中的性能与以往最先进的算法相比，平均提升约1.5%，与原预测损失模型相比，平均提升5%。

關鍵詞： 主动学习深度学习学习损失时间序列

中圖分類號：TP391 文獻標志碼：A DOI: 10.16157/j.issn.0258-7998.234772
中文引用格式： 王繹翔. 用于主動學習的時序特征融合預測損失網(wǎng)絡[J]. 電子技術應用，2024，50(6)：10-17.
英文引用格式： Wang Yixiang. Temporal feature fusion learning loss model for active learning[J]. Application of Electronic Technique，2024，50(6)：10-17.

Temporal feature fusion learning loss model for active learning

Wang Yixiang

School of Information Science and Engineering， Ningbo University

Abstract： Using active learning models to select the most valuable data points for annotation is one way that deep learning reduces the amount of labeled data required. Prediction loss models are a type of task-agnostic active learning models that perform well across multiple tasks. However, these models are not end-to-end models, and changing input features can lead to input bias during the training of the loss prediction network. This paper proposes a temporal feature fusion prediction loss model to address the issue of input bias in such models. Experiments demonstrate that the method proposed in this paper achieves an average performance improvement of approximately 1.5% across various tasks compared to previous state-of-the-art methods, and an average improvement of 5% compared to the original prediction loss model.

Key words : active learning；deep learning；learning loss；time series

引言

近年來，深度網(wǎng)絡在多個任務中取得了許多突破性進展[1]。但是，深度網(wǎng)絡的訓練需要大量的標注數(shù)據(jù)，在很多任務中，標注數(shù)據(jù)的獲取需要專家進行標注，成本很高。

主動學習是一種可行的用于減少模型對標注數(shù)據(jù)量依賴的方法。主動學習模型主要由3個部分組成，即目標任務模塊、主動學習模塊和標注模塊。目標任務模塊用于在現(xiàn)有的標注數(shù)據(jù)集上訓練用于目標任務(分類、分割等)的模型。主動學習模塊通過主動學習的選擇算法來選擇合適的樣本用于標注。注釋模塊主要根據(jù)主動學習模塊選擇的樣本為其打上標簽并放入標注數(shù)據(jù)集中用于下一輪訓練。在一般的任務中，注釋模塊由專家來完成，專家為選擇的樣本標注后加入到標注數(shù)據(jù)集中。因此，設計主動學習的選擇算法是主動學習的核心任務。

現(xiàn)有的選擇算法主要有三類，即基于樣本的不確定性的算法、基于樣本的多樣性的算法以及不確定性和多樣性結合的算法。其中，早期的選擇算法在文獻[2]中進行描述?；跇颖镜牟淮_定性的算法選擇對于任務模型而言預測最不確定的數(shù)據(jù)交給專家進行標注[3-4]?；跇颖镜亩鄻有缘乃惴▌t選擇最具有多樣性或代表性的數(shù)據(jù)交給專家進行標注[5-6]。不確定性和多樣性結合的算法則綜合以上兩點來對樣本進行評估和選擇[7]。

目前的主動學習模型主要有任務依賴的模型和任務不可知的模型兩類。大多數(shù)主動學習模型屬于任務依賴型主動學習模型[8]。針對某項特定的目標任務進行選擇算法的設計，這些算法往往只能適用于某項特定任務，可擴展性和任務泛化性較差。近年來，許多與任務無關的主動學習模型被提出并用于各個任務中，這類模型在多類任務中都有很好的效果。

本文詳細內(nèi)容請下載：

http://ihrv.cn/resource/share/2000006022

作者信息：

王繹翔

（寧波大學信息科學與工程學院，浙江寧波 355211）

Magazine.Subscription.jpg

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權禁止轉(zhuǎn)載。

相關內(nèi)容