基于多粒度特征感知的FoveaBox綠色蘋果抗遮擋檢測模型

打開文本圖片集
摘要:
目標果實檢測精度直接影響果園智能作業(yè)的效率,當前以卷積神經(jīng)網(wǎng)絡為代表的特征提取網(wǎng)絡僅從局部感受野中提取特征用于目標檢測,果實受枝葉遮擋或果實間重疊時存在一定的局限性,導致檢測精度偏低。為提升被遮擋目標果實的檢測精度,提出抗遮擋的FoveaBox果實檢測優(yōu)化模型。首先,新模型引入Swin Transformer作為骨干網(wǎng)絡,通過計算塊間的相似度,打破傳統(tǒng)卷積僅從局部區(qū)域提取特征的限制,從而增強特征映射的表征能力;其次,采用特征金字塔網(wǎng)絡,通過橫向連接和自頂向下結(jié)構(gòu)聚合淺層高分辨率特征與高層語義信息,輸出金字塔型特征映射;然后,將金字塔型特征映射輸入Fovea頭部網(wǎng)絡中,利用分類子網(wǎng)絡與邊界框子網(wǎng)絡進行檢測目標;最后,通過焦點損失函數(shù)Focal Loss與Smooth L1對模型進行迭代尋優(yōu),直至模型收斂。(剩余12951字)