pytorch数据集

做博客实际上是一个沉淀的过程,做过的事情不能就淡淡的做过了,记录下来,是不是再看一看,做过的的东西就不容易忘记。或者说要再做的时候,再拿出来看一看,也会更快入手,还有一点就是证明你确实有做过东西了。我相信没有什么是太晚的,一切最好的开始就是现在,养成习惯是最好的。

说实话,数据集是整个过程中最繁琐的,当时我在做NTU的实验的时候,就是因为数据集部分没有做好,耽搁了很长的时间,还是着了没人带的亏。所以这个部分的话一定要知道很完整的过程,然后要避开中间的坑。
整个数据集处理的过程大概分成3个部分:源数据的预处理(数据格式的转换,生成各种适配文件),生成数据集(batch,多GPU数据与标签对应的问题,数据的预处理等),加载数据集(和前面类似)。

请作者喝杯咖啡吧!