Challenger AI场景分类初步试验
Link:
昨天下载了场景分类的数据,印象里面大小是3.5G,毕竟看了下,这个应该算是流程上最简单的。主要任务就是80类别的图片分类任务,图片大概是五万多张,懒得终端统计了,凭印象吧。
Setup
- 网络结构ResNet18, train from scratch。
- 未区分训练与验证,所以目前的结果只是封闭测试的结果。
- SGD, base lr 0.1[*0.1 per 30 epochs], 90 epochs, weight_decay 1e-4, momentum 0.9, batch size 256.
试验结果
最后一次epoch出来的模型,重新全跑数据集,Top5的正确率在100%,因为是封闭测试,所以达到100%也是可能的。Top1的在99.9%级别上。
一些分析
- 数据集的数据量是不算大的,总共就五万多张训练,对于一个分类任务来说,不算大规模。
- 数据集的复杂度也不高,因为现在使用ResNet18的封闭测试可以达到接近100%的准确率,说明这个ResNet里面最简单的18,就有能力拟合这个数据集了。
- 因为是封闭测试,不能直接说明任务的难度大小,因为还有网络泛化性的考虑。
- 这个试验是很初步的,没有专门调整超参,显然后续即使在ResNet18上也可以有更进一步的提升。
- 比赛很可能最后会演变成小数点后几位的腥风血雨。
对了,关键点的那个数据集,挺养眼的。
210000图片,大概估计有50%都是小清新、cosplay等等的美女照片。