| 基于X-Linear和语义嵌入的视频描述算法 | |
| 所屬分類:技术论文 | |
| 上傳者:zhoubin333 | |
| 文檔大?。?span>608 K | |
| 標(biāo)簽: 视频描述 语义嵌入 X-Linear注意力 | |
| 所需積分:0分積分不夠怎么辦? | |
| 文檔介紹:注意力机制和视频语义嵌入使得视频描述任务取得了显著的提升,为更好地利用时序动态特征和语义信息,提出一种基于X-Linear的语义嵌入视频描述算法(X-Linear Semantic Embedding Network,XLSNet)。该算法以基于编码解码器网络为基础,使用X-Linear注意力模块对视频特征进行编码,该模块使用双线性池化来增加视频时序特征的高阶交互,最终提取丰富的时序动态特征;为充分利用视频语义信息,使用语义嵌入的GRU和X-Linear作为解码器对视频描述进行生成。为防止过拟合现象,对解码器的GRU使用了层归一化和变分Dropout。所提出的算法仅仅使用了视频帧特征,在公开视频描述数据集MSVD上取得了很好的效果。 | |
| 現(xiàn)在下載 | |
| VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 | |
Copyright ? 2005-2024 華北計(jì)算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號(hào)-2