BiSeNetv3:Rethinking BiSeNet For Real-time Semantic Segmentation
使用 BiSeNet 中的 context path 提取上下文信息,并且针对 GT 利用 Laplacian Conv 生成网络的中间监督信息,使得中间特征更加符合后续任务
使用 BiSeNet 中的 context path 提取上下文信息,并且针对 GT 利用 Laplacian Conv 生成网络的中间监督信息,使得中间特征更加符合后续任务
BiSeNet 的升级版,相比较 BiSeNet,BiSeNetv2 精度和速度均有大幅度提升
APCNet 提出 ACM 模块,满足语义分割的分辨率自适应、多尺度、自注意力 3 个条件,使得模型效果更好
ACNet 利用 "结构重参数化" 的概念,训练时该块使用三个不对称卷积块卷积分支,推理时将三个分支的融合成 1
个分支,使得训练时性能得到提升的同时,不降低推理的速度
在 Pytorch 搭建模型
将 15 种语义分割函数分为 4 类进行归纳总结,并提出 Log-Cosh Dice Loss 损失
继 Alexnet 后,通过观察卷积神经网络某一层的特征图,系统分析了卷积神经网络处理图片的原理,包括:(1) 卷积神经网络自动学习区域相关性;(2) 卷积神经网络是学习了关键区域的特征,而不是全局特征;(3) 卷积神经网络的特征是多层抽象的;(4) 浅层卷积神经网络收敛更快;(5) 卷积神经网络具有大小不变性、尺度不变性、旋转不变性
本文在 FCOS+ATSS 的基础上设计了 iou 感知分数分支,用于联合 iou 预测分支及框预测分支,并在此分支上应用设计的 VFL 损失函数,实现更加有效的目标检测
VGGNet 探索了卷积神经网络的深度与其性能之间的关系,成功地构筑了 16~19 层深的卷积神经网络,证明了增加网络的深度能够在一定程度上影响网络最终的性能,使错误率大幅下降,同时拓展性又很强,迁移到其它图片数据上的泛化性也非常好