Challenger AI场景分类初步试验

Link:

昨天下载了场景分类的数据,印象里面大小是3.5G,毕竟看了下,这个应该算是流程上最简单的。主要任务就是80类别的图片分类任务,图片大概是五万多张,懒得终端统计了,凭印象吧。

Setup

  1. 网络结构ResNet18, train from scratch。
  2. 未区分训练与验证,所以目前的结果只是封闭测试的结果。
  3. SGD, base lr 0.1[*0.1 per 30 epochs], 90 epochs, weight_decay 1e-4, momentum 0.9, batch size 256.

试验结果

最后一次epoch出来的模型,重新全跑数据集,Top5的正确率在100%,因为是封闭测试,所以达到100%也是可能的。Top1的在99.9%级别上。

一些分析

  1. 数据集的数据量是不算大的,总共就五万多张训练,对于一个分类任务来说,不算大规模。
  2. 数据集的复杂度也不高,因为现在使用ResNet18的封闭测试可以达到接近100%的准确率,说明这个ResNet里面最简单的18,就有能力拟合这个数据集了。
  3. 因为是封闭测试,不能直接说明任务的难度大小,因为还有网络泛化性的考虑。
  4. 这个试验是很初步的,没有专门调整超参,显然后续即使在ResNet18上也可以有更进一步的提升。
  5. 比赛很可能最后会演变成小数点后几位的腥风血雨。

对了,关键点的那个数据集,挺养眼的。

210000图片,大概估计有50%都是小清新、cosplay等等的美女照片。