MLP-Mixer MLP 换用 CNN 的玩具结果

Link:

水私人KPI。

https://www.zhihu.com/question/457926000/answer/1871444516 的好奇后果,直接在 patch 后接传统Conv。

结构

速度

运算速度比 Res34 略慢

参数量

33.4m,作为对比 Res34=21.8m 左右

精度

Best acc = 70.7680 @ Epoch 81

训练策略

显然,还有很多空间可挖。

可视化

第一层 projector 的可视化

作为对比的 Res18 的 7x7(非 torchvision 官方)