深度学习数据集+模型说明
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
深度学习数据集+模型说明
1、mnist
Google实验室的Corinna Cortes和纽约⼤学柯朗研究所的Yann LeCun建的⼀个⼿写数字数据库,训练库有60,000张⼿写数字图像,测试库有10,000张。
对应的⼿写识别模型为LeNet。
2、cifar10
由Hinton的两个⼤弟⼦Alex Krizhevsky、Ilya Sutskever收集的⼀个⽤于普适物体识别的数据集。
Cifar是加拿⼤牵头投资的⼀个先进科学项⽬研究所。
CIFAR-10数据集包含60000个32*32的彩⾊图像,共有10类。
有50000个训练图像和10000个测试图像。
数据集分为5个训练块和1个测试块,每个块有10000个图像。
测试块包含从每类随机选择的1000个图像。
训练块以随机的顺序包含这些图像,但⼀些训练块可能⽐其它类包含更多的图像。
训练块每类包含5000个图像。
类间完全互斥。
这个数据集最⼤的特点在于将识别迁移到了普适物体,⽽且应⽤于多分类(姊妹数据集Cifar-100达到100类,ILSVRC⽐赛则是1000类)。
同已经成熟的⼈脸识别相⽐,普适物体识别挑战巨⼤,数据中含有⼤量特征、噪声,识别物体⽐例不⼀,⽽且分类庞⼤。
3、cifar100
数据集包含100⼩类,每⼩类包含600个图像,其中有500个训练图像和100个测试图像。
100类被分组为20个⼤类。
每个图像带有1个⼩类
的“fine”标签和1个⼤类“coarse”标签。
4、ImageNet
ImageNet 是⼀个计算机视觉系统识别项⽬,是⽬前世界上图像识别最⼤的数据库。
2010年,来⾃斯坦福⼤学、普林斯顿⼤学及哥伦⽐亚⼤学的科学家们启动ImageNet⼤规模视觉识别挑战赛(ImageNet Large Scale Visual Recognition Challenge,ILSVRC)。
ILSVRC2012是2012年的⽐赛数据集,在此次⽐赛中,Alex提出的AlexNet⽹络结构模型赢得了冠军;ILSVRC2014是2014年的⽐赛数据集,在此次⽐赛中,GoogLeNet,VGGNet分获冠亚军。