针对上面内容分为两块内容:1、基于卷积神经网络的CV Backbone:1.
Resnet系列;2.
Unet系列等;2、基于Transformer的 CV Backbone:1.
Vit系列等;3、在多模态中常用的backbone如:SAM/Clip等