基于深度注意力的融合全局和語(yǔ)義特征的圖像描述模型
所屬分類(lèi):技術(shù)論文
上傳者:wwei
文檔大小:907 K
標(biāo)簽: 圖像描述 全局特征 語(yǔ)義特征
所需積分:0分積分不夠怎么辦?
文檔介紹:現(xiàn)有的圖像描述模型使用全局特征時(shí)受限于感受野大小相同,而基于對(duì)象區(qū)域的圖像特征缺少背景信息。為此,提出了一種新的語(yǔ)義提取模塊提取圖像中的語(yǔ)義特征,使用多特征融合模塊將全局特征與語(yǔ)義特征進(jìn)行融合,使得模型同時(shí)關(guān)注圖像的關(guān)鍵對(duì)象內(nèi)容信息和背景信息。并提出基于深度注意力的解碼模塊,對(duì)齊視覺(jué)和文本特征以生成更高質(zhì)量的圖像描述語(yǔ)句。所提模型在Microsoft COCO數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)評(píng)估,分析結(jié)果表明該方法能夠明顯提升描述的性能,相較于其他先進(jìn)模型具有競(jìng)爭(zhēng)力。
現(xiàn)在下載
VIP會(huì)員,AET專(zhuān)家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。