特黄三级爱爱视频|国产1区2区强奸|舌L子伦熟妇aV|日韩美腿激情一区|6月丁香综合久久|一级毛片免费试看|在线黄色电影免费|国产主播自拍一区|99精品热爱视频|亚洲黄色先锋一区

基于Transformer的圖像分類網(wǎng)絡(luò)MultiFormer

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要:為解決目前ViT模型無法改變輸入補(bǔ)丁大小且輸入補(bǔ)丁都是單一尺度信息的缺點(diǎn),提出了一種基于Transformer的圖像分類網(wǎng)絡(luò)MultiFormer。MultiFormer通過AWS(attention with scale)模塊,將每階段不同尺度輸入小補(bǔ)丁嵌入為具有豐富語義信息的大補(bǔ)??;通過GLA-P(global-local attention with patch)模塊交替捕獲局部和全局注意力,在嵌入的同時(shí)保留了細(xì)粒度和粗粒度特征。(剩余17559字)

目錄
monitor