INRIA Holidays
http://lear.inrialpes.fr/~jegou/data.php
INRIA Holidays dataset,Herve Jegou等人使用的数据集,该数据集是他们研究所经常度假时拍的图片(风景为主),一共1491张图,500张query(一张图一个group)和对应着991张相关图像,已提取了128维的SIFT点4455091个,visual dictionaries来自Flickr60K。
Oxford Buildings
http://www.robots.ox.ac.uk/~vgg/data/oxbuildings/
The Oxford Buildings Dataset,oxford的VGG组从Flickr搜集了5062张建筑物图像。
Oxford Paris
http://www.robots.ox.ac.uk/~vgg/data/parisbuildings/
The Paris Dataset,oxford的VGG组从Flickr搜集了6412张巴黎旅游图片,包括Eiffel Tower等。
201Books and CTurin180
http://pacific.tilab.com/www/datasets/
The CTurin180 and 201Books Data Sets,2011.5,Telecom Italia提供于Compact Descriptors for Visual Search,该数据集包括:Nokia E7拍摄的201本书的封面图片(多视角拍摄,各6张),共1.3GB; Turin市180个建筑的视频图像,拍摄的camera有Galaxy S、iPhone 3、Canon A410、Canon S5 IS,共2.7GB。
Stanford Mobile Visual Search
http://purl.stanford.edu/rb470rw0983
patch 数据集 http://blackhole1.stanford.edu/ivms/Datasets.htm
tanford Mobile Visual Search Dataset,2011.2,stanford提供,包括8种场景,如CD封面、油画等,每组相关图片都是采自不同相机(手机),所有场景共500张图;
以后又发布了一个patch数据集,Compact Descriptors for Visual Search Patches Dataset,校对了相同patch。
UKBench
http://www.vis.uky.edu/~stewe/ukbench/
UKBench database,2006.7,Henrik Stewénius在他CVPR06文章中提供的数据集,图像都为640*480,每个group有4张图,文件接近2GB,提供visual words。
MIR-FLICKR
MIR-FLICKR-1M,2010,1M张Flickr上的图片,也提供25K子集下载。
http://press.liacs.nl/mirflickr/#sec_download
YFCC 100M
http://webscope.sandbox.yahoo.com/catalog.php?datatype=i&did=67
YFCC 100M (Yahoo Flickr Creative Commons 100M 14G). 由Yahoo Flickr提供的多达1亿张图片的数据集。
Corel Image Features Datasets
https://archive.ics.uci.edu/ml/datasets/Corel+Image+Features
Corel图像数据库中有1000幅图像数据。已经预先对其量化:非洲人、海滩、汽车、建筑、恐龙、大象、骏马、鲜花、雪山以及食物10个具有语义特征类型,可以被应用量化判断方法,,客观的评价图像检索系统。
Ponce Group
http://www-cvr.ai.uiuc.edu/ponce_grp/data/
UIUC Ponce Group收集的一些数据集
ClickDamage
http://clickdamage.com/sourcecode/cv_datasets.php
一个简易图像分享站提供的数据集索引
cifar-10
http://www.cs.toronto.edu/~kriz/cifar.html
其他数据集
计算机视觉的一些测试数据集和源码站点
机器视觉中常用的数据测试集
目标检测、跟踪和图像检索 数据库
关于NIPS 2015 的补充
关于 反向传播,卷积神经网络,递归神经网络和 LSTM 结构的总结。
Farabat at al. ICML 2012 PAMI 2013
在2D图像上的应用:场景解析/ 标记(scene parsing / labelling),比如在图片中的建筑上标上“建筑”。
参考资料
[1] 图像检索公开数据集
[2] BAE Systems ARGUS-IS
[3]
[4]
[5] 学术搜索 ArnetMiner
[6] LeCun & BengioNIPS 2015 深度学习专题论坛实录(35PPT)
[7] 【干货】NIPS 2015中有趣又看得懂的工作
[8] 《Python计算机视觉编程》学习笔记
[9] 图像验证码和大规模图像识别技术