计算机视觉算法与应用的一些测试数据集和源码站点
计算机视觉代码合集
计算机视觉是结合了传统摄影测量,现代计算机信息技术、人工智能等多学科的一个大学科,是一片开垦不足的大陆,路很远,但很多人都在跋涉!
本文转自CSDN(地址/whucv/article/details/7907391),是一篇很好的算法与代码总结文档,转载在此供大家学习参考。
http://cvlab.epfl.ch/research/detect/brief/
Dimension Reduction
Diffusion maps
/~annlee/software.htm
Dimension Reduction
Dimensionality Reduction Toolbox
http://homepage.tudelft.nl/19j49/Matlab_Toolbox_for_Dimensionality_Reduction.html
Shared Matting
E. S. L.Gastaland M. M. Oliveira, Computer Graphics Forum, 2010
http://www.inf.ufrgs.br/~eslgastal/SharedMatting/
Alpha Matting
Bayesian Matting
Camera Calibration
EpipolarGeometry Toolbox
G.L.Mariottini, D.Prattichizzo, EGT: a Toolbox for Multiple View Geometry and VisualServoing, IEEE Robotics & Automation Magazine, 2005
图像识别中的常用数据集介绍(六)
图像识别中的常用数据集介绍近年来,随着深度学习和人工智能的迅速发展,图像识别技术取得了重大突破。
而构建高质量的训练数据集是图像识别中的关键一环。
在图像识别领域,有一些常用的数据集已经成为了研究的基准,本文将介绍其中几个常用的数据集。
1. MNISTMNIST(Modified National Institute of Standards and Technology)数据集是图像分类领域最常用的数据集之一。
它包含了手写数字图片,每个图片都是28x28像素的灰度图像。
MNIST数据集一共包含了60,000张训练图片和10,000张测试图片。
这个数据集可以用于训练和评估各种图像分类算法的性能。
2. CIFAR-10CIFAR-10(Canadian Institute for Advanced Research)数据集是另一个常用的图像分类数据集。
它包含了10个不同的类别,每个类别有6000张32x32像素的彩色图像。
CIFAR-10数据集一共包含了60,000张训练图片和10,000张测试图片。
这个数据集的难度相对于MNIST更高,因为它是彩色图像。
3. ImageNetImageNet数据集是目前最大和最全面的图像识别数据集之一。
它包含了超过1400万张高分辨率图片,涵盖了超过一千个不同的类别。
ImageNet数据集可以用于训练深度神经网络模型,尤其是卷积神经网络(Convolutional Neural Networks, CNNs)。
4. COCOCOCO(Common Objects in Context)数据集是用于目标检测和图像分割任务的数据集之一。
它包含了超过330,000张图像,涵盖了80个不同的对象类别。
COCO数据集的特点是每个图像都包含了一个复杂的场景,并且每个图像都标有多个对象的边框和分割掩码。
这些是图像识别领域中常用的几个数据集,还有一些其他的数据集也被广泛应用,如PASCAL VOC、Cityscapes等。
计算机视觉的算法与应用
计算机视觉的算法与应用计算机视觉是计算机科学领域中的一个重要研究方向,致力于使计算机系统具备感知和理解图像或视频的能力。
通过使用各种算法和技术,计算机视觉可以实现图像识别、目标检测、人脸识别、图像分割等功能,广泛应用于人工智能、机器人技术、安防监控、自动驾驶等领域。
一、图像处理算法图像处理算法是计算机视觉的基础,主要用于图像的预处理和特征提取。
常见的图像处理算法包括边缘检测、滤波、形态学处理等。
1. 边缘检测边缘检测算法用于从图像中检测出物体的边缘。
常用的边缘检测算法有Sobel算子、Canny算子和Laplacian算子。
这些算法可以通过计算图像中像素点的梯度或二阶导数来找到图像的边缘。
2. 滤波滤波算法用于对图像进行平滑或增强处理。
平滑滤波可以降低图像的噪声,常见的平滑滤波算法有均值滤波和高斯滤波。
增强滤波可以增加图像的对比度或细节信息,如直方图均衡化算法和锐化滤波算法。
3. 形态学处理形态学处理算法用于对二值图像进行形态学操作,如腐蚀、膨胀、开运算和闭运算。
这些操作可以改变图像中物体的形态和结构,用于去除噪声、填充空洞或分离连通区域。
二、图像识别与分类算法图像识别与分类算法旨在将图像分为不同的类别或识别出图像中的目标物体。
常见的图像识别与分类算法包括基于特征的分类方法和深度学习方法。
1. 基于特征的分类方法基于特征的分类方法使用手工设计的特征来表示图像,并使用分类器对图像进行分类。
常用的特征包括颜色直方图、纹理特征和形状特征。
常见的分类器有SVM、KNN和决策树等。
2. 深度学习方法深度学习方法是近年来计算机视觉领域的重要突破,其利用深度神经网络从数据中自动学习特征表示,并通过分类器进行分类。
常用的深度学习模型包括卷积神经网络(CNN)和循环神经网络(RNN)等。
这些模型在图像识别和目标检测任务中取得了显著的成果。
三、计算机视觉的应用计算机视觉技术在各个领域都有广泛的应用,为人们的生活和工作带来了诸多便利。
图像识别中的常用数据集介绍(五)
图像识别中的常用数据集介绍引言:随着人工智能的快速发展,图像识别成为了研究和应用领域中的热点问题。
而在图像识别中,数据集的选择对算法的训练和评估起着至关重要的作用。
本文将为大家介绍一些常用的图像识别数据集,帮助读者了解图像识别领域的最新进展。
一、ImageNetImageNet是一个大规模图像数据库,是目前最经典的图像识别数据集之一。
包含了超过一千万张手动标注的高分辨率图像,涵盖了从动物、植物到自然场景等多个类别。
ImageNet的发布促进了卷积神经网络(Convolutional Neural Network,CNN)的快速发展,对于图像识别算法的性能提升起到了重要作用。
研究人员可以通过参与ImageNet挑战赛来测试自己的算法性能。
二、CIFARCIFAR数据集是一个广泛用于图像分类基准测试的数据集。
CIFAR-10包含了60000张32x32像素的彩色图片,分为10个类别,每个类别有6000张图像。
而CIFAR-100数据集则包含了100个类别。
CIFAR数据集的图像相对ImageNet来说更加小巧,训练和测试时间相对较短,是很多图像分类算法的常用选择。
三、MNISTMNIST是一个经典的手写数字识别数据集,包含了60000张28x28像素的手写数字图片。
MNIST是深度学习领域中非常重要的一个基准测试数据集,被广泛应用于各种深度学习算法的训练和评估。
相对于ImageNet等大规模数据集,MNIST更加简单,但也提供了验证算法性能的有效手段。
四、PASCAL VOCPASCAL VOC是计算机视觉领域中的一个标准数据集,被广泛用于目标检测、图像分割和3D物体识别等任务。
PASCAL VOC数据集包括了20个不同类别的物体,每个类别都有数百张标注图像。
通过参与PASCAL VOC竞赛,研究人员可以针对目标检测和图像分割等任务进行算法的研发和评估。
五、MS COCOMS COCO是一个广泛使用的综合性图像数据集,包含了超过330K 张图像和250K个物体实例的标注。
计算机视觉模型数据准备-常见计算机视觉数据集及格式
cifar-100 数 据 集 包 含 100 小 类 , 每 小 类 包 含600个图像,其中有500个训练图像和100个 测 试 图 像 。 与 c i f a r- 1 0 不 同 的 是 , 1 0 0 类 被 分 组 为20个大类,而每一个大类,又可以细分为子 类,所以每个图像带有1个小类的“fine”标签 和1个大类“coarse”标签。
最早的深度卷积网络LeNet便是针对MNIST 数据集的,而且当前主流深度学习框架几乎无一 例外将MNIST数据集的处理作为介绍及入门第一 教程。
▲ MNIST数据集示例图片
常见计算机视觉数据集及格式
2 ImageNet数据集
ImageNet 数据集有1400多万幅图片,涵盖2万多个类别;其中有超过百万的图片有明确的类别 标注和图像中物体位置的标注,具体信息及说明如下表:
4 PASCAL数据集
PA S C A L 是 一 个 用 于 模 式 分 析 和 统 计 建 模 的 数 据 集 , 包 括 图 像 分 类 , 目 标 检 测 , 分 割 等 任 务 , 是 由PASCAL VOC挑战赛衍生出来的数据集。PASCAL VOC2007之后的数据集包括以下20个类别。
1+X职业技能等级认证
1+X人工智能深度学习工程应用
计算机视觉模型应用
计算机视觉模型数据准备
常见计算机视觉数据集及格式
1 MNIST数据集
MNIST是机器学习入门的标准数据集,共10 个类别,由来自250 个不同人的0-9手写数字构 成,测试集也是同样比例的手写数字数据。包含 了60,000 张28x28的二值训练图像,10,000张 28x28的二值测试图像。
目标检测算法评估方法总结及标准基准数据集分享
目标检测算法评估方法总结及标准基准数据集分享目标检测是计算机视觉领域中一项核心任务,广泛应用于目标识别、物体跟踪、场景分析等诸多领域。
随着深度学习的快速发展,目标检测算法不断涌现,从传统方法到基于深度学习的方法,不同的算法具备不同的性能表现。
为了对这些算法进行客观评估和比较,我们需要合适的评估方法和标准基准数据集。
一、目标检测算法评估方法总结1. 准确度指标目标检测算法的准确度是评估算法性能的重要指标之一。
常见的准确度指标包括精确率(precision)、召回率(recall)和 F1 值。
精确率指的是算法检测到的目标中真正属于目标的比例,召回率指的是所有真实目标中被算法正确检测到的比例,F1 值是精确率和召回率的加权平均值。
此外,还可以采用平均准确度均值(mean Average Precision,mAP)来综合评估算法在不同目标类别上的准确度。
2. 多尺度评估由于目标在图片中的大小会有所不同,一个好的目标检测算法应该能够在不同尺度下准确地检测目标。
因此,多尺度评估是评估目标检测算法性能的重要方法之一。
在多尺度评估中,我们可以采用不同的尺度对测试集进行缩放,并统计算法在不同尺度下的准确度指标。
3. 视频序列评估与图像不同,视频序列包含了连续的图像帧。
对于目标检测算法来说,连续图像帧之间的目标应该能够正确地跟踪,并保持一致的标识。
因此,视频序列评估是评估目标检测算法性能的重要手段之一。
在视频序列评估中,我们可以统计目标检测算法在跟踪目标时的准确度、时序一致性等指标。
4. 实时性评估对于许多实时应用场景来说,目标检测算法的实时性是一个关键的指标。
实时性评估通常涉及算法的运行速度、处理帧率等指标。
评估算法在不同硬件设备上的运行速度,并考虑视频帧率是否满足实时需求,有助于判断算法是否适用于实时应用。
二、标准基准数据集分享为了评估不同的目标检测算法,在计算机视觉研究中建立了许多标准基准数据集。
这些数据集包含了大量的真实世界图像,其中标注了目标的位置和类别信息,使得研究人员能够对算法进行客观、公正的评估和比较。
目标检测算法源代码
目标检测算法源代码目标检测算法是计算机视觉领域中的一项重要技术,它可以从图像或视频中识别和定位特定目标。
这篇文章将介绍一个常用的目标检测算法的源代码,帮助读者了解该算法的实现原理和步骤。
一、算法背景目标检测算法的目标是从图像中找出目标的位置,并给出其所属的类别。
这个算法在很多应用场景中都有广泛的应用,比如智能交通监控、人脸识别等。
其中一个常用的目标检测算法是基于深度学习的物体检测算法,它利用卷积神经网络(Convolutional Neural Network,CNN)来提取图像的特征,并通过分类器对不同类别的目标进行分类。
二、算法步骤该目标检测算法的源代码主要包括以下几个步骤:1. 数据准备:首先需要准备训练数据集和测试数据集。
训练数据集包含标注好的图像和对应的目标类别,用于训练模型。
测试数据集用于评估模型的准确性。
2. 特征提取:利用卷积神经网络从图像中提取特征。
这个过程通过多个卷积层和池化层来完成,最终得到一组高维特征向量。
3. 区域提议:在特征图上生成一系列候选区域,这些区域可能包含目标。
常用的方法是利用滑动窗口和图像金字塔来生成候选区域。
4. 特征分类:对每个候选区域进行分类,判断其是否包含目标。
这个步骤通常使用支持向量机(Support Vector Machine,SVM)或逻辑回归(Logistic Regression)等分类器来完成。
5. 目标定位:对于被分类为目标的候选区域,进一步利用回归算法来精确定位目标的位置。
常用的方法是利用边界框回归(Bounding Box Regression)来调整候选区域的位置。
三、代码示例下面是一个简化版的目标检测算法源代码示例:```pythonimport cv2import numpy as np# 加载训练好的模型model = cv2.dnn.readNetFromCaffe('deploy.prototxt', 'model.caffemodel')# 加载图像image = cv2.imread('test.jpg')# 图像预处理blob = cv2.dnn.blobFromImage(image, scalefactor=1.0, size=(300, 300), mean=(104.0, 177.0, 123.0), swapRB=True, crop=False)# 输入模型进行目标检测model.setInput(blob)detections = model.forward()# 在图像上绘制检测结果for i in range(detections.shape[2]):confidence = detections[0, 0, i, 2]if confidence > 0.5:box = detections[0, 0, i, 3:7] * np.array([image.shape[1], image.shape[0], image.shape[1], image.shape[0]])(startX, startY, endX, endY) = box.astype("int")cv2.rectangle(image, (startX, startY), (endX, endY), (0, 255, 0), 2)# 显示结果图像cv2.imshow("Output", image)cv2.waitKey(0)cv2.destroyAllWindows()```四、总结本文介绍了一个常用的目标检测算法的源代码,通过对图像进行特征提取、区域提议、特征分类和目标定位等步骤,实现了对目标的检测和定位。
小目标检测数据集介绍
小目标检测数据集介绍小目标检测是计算机视觉领域中的一个重要问题,其目的是在一幅图像中,对其中的小目标进行准确的检测。
这个问题在现实生活中有着广泛的应用,例如智能交通、安防监控等领域。
为了解决小目标检测的问题,需要使用大量的数据进行训练和测试。
因此,小目标检测数据集的建立和使用至关重要。
本文将介绍几个常用的小目标检测数据集和它们的特点及应用,包括COCO、PASCAL VOC、DOTA等。
一、COCO数据集COCO(Common Objects in Context)数据集是当前最为广泛使用的小目标检测数据集之一。
它有超过330K张图像和2.5M的标注,包括人、动物、交通工具等22个类别。
COCO数据集的特点是目标较小,难以检测,同时数据集中的图片内容复杂多样,覆盖面广,让算法在各种场景下都得到了不错的训练。
最近几年,COCO数据集提供了一系列的小目标检测挑战。
如2016年举办的COCO挑战赛,旨在鼓励针对小目标的研究,提高算法的表现。
2017年再次举办了Small Object Detection挑战赛,共有90个参赛团队,提供了一系列高质量的算法和解决方案。
二、PASCAL VOC数据集PASCAL VOC(Visual Object Classes)数据集是一个有着20个类别的小目标检测数据集,包括了动物、食物、家具等常见目标。
它们被标记为中等大小的。
PASCAL VOC数据集旨在对基于分类的视觉对象识别系统进行评估和比较。
同时,PASCAL VOC数据集通过确定目标类型的数量和类别来限制实验,从而减少了训练算法中的噪声。
三、DOTA数据集DOTA(Detection in Aerial Images)数据集是专门为了解决航拍影像小目标检测的问题所建立的一个数据集。
它包含了可训练的2806张图像,每张图像都有7.4K x 7.4K的大小和15m的分辨率,以及生动丰富的样本类别和不同角度的旋转变化。
图像识别中的常用数据集介绍(二)
图像识别是计算机视觉领域中的一个重要研究方向,它旨在让计算机能够理解和识别图像中的物体、场景以及其他图像特征。
在图像识别的算法研究过程中,数据集的选择是至关重要的一步。
本文将介绍一些图像识别中常用的数据集,帮助读者理解和选择适合自己研究方向的数据。
一、CIFAR数据集CIFAR数据集是一个在机器学习领域广泛使用的图像数据集,包含了60,000张32×32大小的彩色图像,分为10个类别,每个类别有6,000张图片。
它是一个比较小但多样化的数据集,适合初学者进行图像分类任务的研究。
CIFAR数据集通常被用于测试卷积神经网络(CNN)的性能。
二、MNIST数据集MNIST数据集是一个经典的手写数字识别数据集,包含了60,000个训练样本和10,000个测试样本。
每个样本都是28×28大小的灰度图像,表示一个手写数字。
MNIST数据集是深度学习领域中最常用的数据集之一,被广泛应用于训练和评估卷积神经网络。
三、ImageNet数据集ImageNet数据集是一个庞大且复杂的图像数据集,拥有数百万张高分辨率图像,涵盖了超过10,000个类别。
ImageNet数据集的目标是让计算机能够在大规模图像数据上进行物体识别和分类。
因为其规模较大,ImageNet数据集通常被用来训练大型深度神经网络模型,如AlexNet、VGGNet和ResNet等。
四、PASCAL VOC数据集PASCAL VOC数据集是一个针对对象检测和图像分割任务的数据集,它包含了20个类别的物体和场景,在训练集、验证集和测试集上共有17,125张图像。
PASCAL VOC数据集被广泛应用于研究和评估目标检测和图像分割算法,在计算机视觉领域具有重要的影响力。
五、COCO数据集COCO数据集是一个非常大且复杂的图像数据集,用于对象检测、场景解析和图像分割等任务。
COCO数据集包含了超过200,000张图像,涵盖了80个类别的物体和场景。
《计算机视觉》题集
《计算机视觉》题集大题一:选择题1.下列哪项不属于计算机视觉的基本任务?A. 图像分类B. 目标检测C. 语音识别D. 语义分割2.在卷积神经网络(CNN)中,以下哪项操作不是卷积层的主要功能?A. 局部感知B. 权重共享C. 池化D. 特征提取3.下列哪个模型在图像分类任务中首次超过了人类的识别能力?A. AlexNetB. VGGNetC. ResNetD. GoogleNet4.以下哪个算法常用于图像中的特征点检测?A. SIFTB. K-meansC. SVMD. AdaBoost5.在目标检测任务中,IoU (Intersection over Union)主要用于衡量什么?A. 检测框与真实框的重叠程度B. 模型的检测速度C. 模型的准确率D. 模型的召回率6.下列哪项技术可以用于提高模型的泛化能力,减少过拟合?A. 数据增强B. 增加模型复杂度C. 减少训练数据量D. 使用更大的学习率7.在深度学习中,批归一化 (Batch Normalization)的主要作用是什么?A. 加速模型训练B. 提高模型精度C. 减少模型参数D. 防止梯度消失8.下列哪个激活函数常用于解决梯度消失问题?A. SigmoidB. TanhC. ReLUD. Softmax9.在进行图像语义分割时,常用的评估指标是?A. 准确率B. 召回率C. mIoU(mean Intersection over Union)D. F1分数10.下列哪个不是深度学习框架?A. TensorFlowB. PyTorchC. OpenCVD. Keras大题二:填空题1.计算机视觉中的“三大任务”包括图像分类、目标检测和______。
2.在深度学习模型中,为了防止梯度爆炸,常采用的技术是______。
3.在卷积神经网络中,池化层的主要作用是进行______。
4.YOLO算法是一种流行的______算法。
5.在进行图像增强时,常用的技术包括旋转、缩放、______和翻转等。
如何实现计算机视觉的目标检测10行Python代码帮你实现
如何实现计算机视觉的目标检测10行Python代码帮你实现只需10行Python代码,我们就能实现计算机视觉中目标检测。
from imageai.Detection import ObjectDetectionimport osexecution_path = os.getcwd()detector = ObjectDetection()detector.setModelTypeAsRetinaNet()detector.setModelPath( os.path.join(ex ecution_path , "resnet50_coco_best_v2.0.1.h5"))detector.loadModel()detections = detector.detec tObjectsFromImage(input_image=os.path.join(execution_path , "image.jpg"), output_image_pat h=os.path.join(execution_path , "imagenew.jpg"))for eachObject in detections:print(eachObject[ "name"] + " : " + eachObject["percentage_probability"] )没错,用这寥寥10行代码,就能实现目前AI产品中应用广泛的目标检测技术。
看完了代码,下面容我们聊聊目标检测背后的技术背景,并解读这10行Python代码的由来和实现原理。
目标检测简介人工智能的一个重要领域就是计算机视觉,它是指计算机及软件系统识别和理解图像与视频的科学。
计算机视觉包含很多细分方向,比如图像识别、目标检测、图像生成和图像超分辨率等。
图像识别中的常用数据集介绍(八)
图像识别中的常用数据集介绍导语:近年来,随着人工智能和深度学习的迅猛发展,图像识别已经成为计算机视觉领域的热门话题。
而在图像识别的研究过程中,数据集的选择对于模型的训练和性能评估至关重要。
本文将介绍几个常见的图像识别数据集,包括MNIST、CIFAR-10、ImageNet和COCO,并探讨其特点和应用。
一、MNIST数据集MNIST是一个经典的手写数字数据集,由来自美国国家标准与技术研究所(NIST)的四位作者构建。
该数据集包含60,000个训练样本和10,000个测试样本,每个样本都是28x28像素的灰度图像。
MNIST主要用于图像分类任务,例如将手写数字图像分为0-9的十个数字。
MNIST数据集相对简单,是深度学习初学者常用的入门数据集。
它已经被广泛研究和应用,并被用作深度学习算法的基准测试。
虽然MNIST数据集在一些具有挑战性的任务中可能过于简单,但它可以帮助我们快速验证和理解算法的基本性能。
二、CIFAR-10数据集CIFAR-10是一个由加拿大计算机科学和人工智能研究所(CIFAR)创建的图像分类数据集。
它包含10个类别的60,000个32x32彩色图像,每个类别有6,000个样本。
这些类别包括了常见的物体,如飞机、汽车、狗、猫等。
CIFAR-10数据集中的图像复杂度相对较高,是进一步挑战算法性能的好选择。
CIFAR-10数据集常用于图像分类和目标检测任务。
许多研究者在此数据集上测试和比较不同的深度学习模型,以提高分类准确性和模型性能。
三、ImageNet数据集ImageNet是一个大型的图像识别数据集,由斯坦福大学的李飞飞教授创建。
该数据集包含超过1,200万个图像样本,分为1,000个不同的类别。
ImageNet数据集的样本数量和类别多样性更高于MNIST和CIFAR-10,使得它成为真实场景图像识别的重要基准数据集。
ImageNet数据集对于深度学习研究的贡献巨大。
其中,ImageNet挑战赛(ILSVRC)是一个世界级的图像识别比赛,吸引了来自全球各地的研究者参与。
计算机视觉、机器学习相关领域论文和源代码大集合
计算机视觉、机器学习相关领域论文和源代码大集合--持续更新……zouxy09@/zouxy09注:下面有project网站的大部分都有paper和相应的code。
Code一般是C/C++或者Matlab代码。
最近一次更新:2013-3-17一、特征提取Feature Extraction:·SIFT [1] [Demo program][SIFT Library] [VLFeat]·PCA-SIFT [2] [Project]·Affine-SIFT [3] [Project]·SURF [4] [OpenSURF] [Matlab Wrapper]·Affine Covariant Features [5] [Oxford project]·MSER [6] [Oxford project] [VLFeat]·Geometric Blur [7] [Code]·Local Self-Similarity Descriptor [8] [Oxford implementation]·Global and Efficient Self-Similarity [9] [Code]·Histogram of Oriented Graidents [10] [INRIA Object Localization Toolkit] [OLT toolkit for Windows]·GIST [11] [Project]·Shape Context [12] [Project]·Color Descriptor [13] [Project]·Pyramids of Histograms of Oriented Gradients [Code]·Space-Time Interest Points (STIP) [14][Project] [Code]·Boundary Preserving Dense Local Regions [15][Project]·Weighted Histogram[Code]·Histogram-based Interest Points Detectors[Paper][Code]·An OpenCV - C++ implementation of Local Self Similarity Descriptors [Project]·Fast Sparse Representation with Prototypes[Project]·Corner Detection [Project]·AGAST Corner Detector: faster than FAST and even FAST-ER[Project]· Real-time Facial Feature Detection using Conditional Regression Forests[Project]· Global and Efficient Self-Similarity for Object Classification and Detection[code]·WαSH: Weighted α-Shapes for Local Feature Detection[Project]· HOG[Project]· Online Selection of Discriminative Tracking Features[Project]二、图像分割Image Segmentation:·Normalized Cut [1] [Matlab code]·Gerg Mori’ Superpixel code [2] [Matlab code]·Efficient Graph-based Image Segmentation [3] [C++ code] [Matlab wrapper]·Mean-Shift Image Segmentation [4] [EDISON C++ code] [Matlab wrapper]·OWT-UCM Hierarchical Segmentation [5] [Resources]·Turbepixels [6] [Matlab code 32bit] [Matlab code 64bit] [Updated code]·Quick-Shift [7] [VLFeat]·SLIC Superpixels [8] [Project]·Segmentation by Minimum Code Length [9] [Project]·Biased Normalized Cut [10] [Project]·Segmentation Tree [11-12] [Project]·Entropy Rate Superpixel Segmentation [13] [Code]·Fast Approximate Energy Minimization via Graph Cuts[Paper][Code]·Efficient Planar Graph Cuts with Applications in Computer Vision[Paper][Code]·Isoperimetric Graph Partitioning for Image Segmentation[Paper][Code]·Random Walks for Image Segmentation[Paper][Code]·Blossom V: A new implementation of a minimum cost perfect matching algorithm[Code]·An Experimental Comparison of Min-Cut/Max-Flow Algorithms for Energy Minimization in Computer Vision[Paper][Code]·Geodesic Star Convexity for Interactive Image Segmentation[Project]·Contour Detection and Image Segmentation Resources[Project][Code]·Biased Normalized Cuts[Project]·Max-flow/min-cut[Project]·Chan-Vese Segmentation using Level Set[Project]· A Toolbox of Level Set Methods[Project]·Re-initialization Free Level Set Evolution via Reaction Diffusion[Project]·Improved C-V active contour model[Paper][Code]· A Variational Multiphase Level Set Approach to Simultaneous Segmentation and BiasCorrection[Paper][Code]· Level Set Method Research by Chunming Li[Project]· ClassCut for Unsupervised Class Segmentation[cod e]· SEEDS: Superpixels Extracted via Energy-Driven Sampling[Project][other]三、目标检测Object Detection:· A simple object detector with boosting [Project]·INRIA Object Detection and Localization Toolkit [1] [Project]·Discriminatively Trained Deformable Part Models [2] [Project]·Cascade Object Detection with Deformable Part Models [3] [Project]·Poselet [4] [Project]·Implicit Shape Model [5] [Project]·Viola and Jones’s Face Detection [6] [Project]·Bayesian Modelling of Dyanmic Scenes for Object Detection[Paper][Code]·Hand detection using multiple proposals[Project]·Color Constancy, Intrinsic Images, and Shape Estimation[Paper][Code]·Discriminatively trained deformable part models[Project]·Gradient Response Maps for Real-Time Detection of Texture-Less Objects: LineMOD [Project]·Image Processing On Line[Project]·Robust Optical Flow Estimation[Project]·Where's Waldo: Matching People in Images of Crowds[Project]· Scalable Multi-class Object Detection[Project]· Class-Specific Hough Forests for Object Detection[Project]· Deformed Lattice Detection In Real-World Images[Project]· Discriminatively trained deformable part models[Project]四、显著性检测Saliency Detection:·Itti, Koch, and Niebur’ saliency detection [1] [Matlab code]·Frequency-tuned salient region detection [2] [Project]·Saliency detection using maximum symmetric surround [3] [Project]·Attention via Information Maximization [4] [Matlab code]·Context-aware saliency detection [5] [Matlab code]·Graph-based visual saliency [6] [Matlab code]·Saliency detection: A spectral residual approach. [7] [Matlab code]·Segmenting salient objects from images and videos. [8] [Matlab code]·Saliency Using Natural statistics. [9] [Matlab code]·Discriminant Saliency for Visual Recognition from Cluttered Scenes. [10] [Code]·Learning to Predict Where Humans Look [11] [Project]·Global Contrast based Salient Region Detection [12] [Project]·Bayesian Saliency via Low and Mid Level Cues[Project]·Top-Down Visual Saliency via Joint CRF and Dictionary Learning[Paper][Code]· Saliency Detection: A Spectral Residual Approach[Code]五、图像分类、聚类Image Classification, Clustering·Pyramid Match [1] [Project]·Spatial Pyramid Matching [2] [Code]·Locality-constrained Linear Coding [3] [Project] [Matlab code]·Sparse Coding [4] [Project] [Matlab code]·Texture Classification [5] [Project]·Multiple Kernels for Image Classification [6] [Project]·Feature Combination [7] [Project]·SuperParsing [Code]·Large Scale Correlation Clustering Optimization[Matlab code]·Detecting and Sketching the Common[Project]·Self-Tuning Spectral Clustering[Project][Code]·User Assisted Separation of Reflections from a Single Image Using a Sparsity Prior[Paper][Code]·Filters for Texture Classification[Project]·Multiple Kernel Learning for Image Classification[Project]· SLIC Superpixels[Project]六、抠图Image Matting· A Closed Form Solution to Natural Image Matting [Code]·Spectral Matting [Project]·Learning-based Matting [Code]七、目标跟踪Object Tracking:· A Forest of Sensors - Tracking Adaptive Background Mixture Models [Project]·Object Tracking via Partial Least Squares Analysis[Paper][Code]·Robust Object Tracking with Online Multiple Instance Learning[Paper][Code]·Online Visual Tracking with Histograms and Articulating Blocks[Project]·Incremental Learning for Robust Visual Tracking[Project]·Real-time Compressive Tracking[Project]·Robust Object Tracking via Sparsity-based Collaborative Model[Project]·Visual Tracking via Adaptive Structural Local Sparse Appearance Model[Project]·Online Discriminative Object Tracking with Local Sparse Representation[Paper][Code]·Superpixel Tracking[Project]·Learning Hierarchical Image Representation with Sparsity, Saliency and Locality[Paper][Code]·Online Multiple Support Instance Tracking [Paper][Code]·Visual Tracking with Online Multiple Instance Learning[Project]·Object detection and recognition[Project]·Compressive Sensing Resources[Project]·Robust Real-Time Visual Tracking using Pixel-Wise Posteriors[Project]·Tracking-Learning-Detection[Project][OpenTLD/C++ Code]· the HandVu:vision-based hand gesture interface[Project]· Learning Probabilistic Non-Linear Latent Variable Models for Tracking Complex Activities[Project]八、Kinect:·Kinect toolbox[Project]·OpenNI[Project]·zouxy09 CSDN Blog[Resource]· FingerTracker 手指跟踪[code]九、3D相关:·3D Reconstruction of a Moving Object[Paper] [Code]·Shape From Shading Using Linear Approximation[Code]·Combining Shape from Shading and Stereo Depth Maps[Project][Code]·Shape from Shading: A Survey[Paper][Code]· A Spatio-Temporal Descriptor based on 3D Gradients (HOG3D)[Project][Code]·Multi-camera Scene Reconstruction via Graph Cuts[Paper][Code]· A Fast Marching Formulation of Perspective Shape from Shading under FrontalIllumination[Paper][Code]·Reconstruction:3D Shape, Illumination, Shading, Reflectance, Texture[Project]·Monocular Tracking of 3D Human Motion with a Coordinated Mixture of Factor Analyzers[Code]·Learning 3-D Scene Structure from a Single Still Image[Project]十、机器学习算法:·Matlab class for computing Approximate Nearest Nieghbor (ANN) [Matlab class providing interface to ANN library]·Random Sampling[code]·Probabilistic Latent Semantic Analysis (pLSA)[Code]·FASTANN and FASTCLUSTER for approximate k-means (AKM)[Project]·Fast Intersection / Additive Kernel SVMs[Project]·SVM[Code]·Ensemble learning[Project]·Deep Learning[Net]· Deep Learning Methods for Vision[Project]·Neural Network for Recognition of Handwritten Digits[Project]·Training a deep autoencoder or a classifier on MNIST digits[Project]· THE MNIST DATABASE of handwritten digits[Project]· Ersatz:deep neural networks in the cloud[Project]· Deep Learning [Project]· sparseLM : Sparse Levenberg-Marquardt nonlinear least squares in C/C++[Project]· Weka 3: Data Mining Software in Java[Project]· Invited talk "A Tutorial on Deep Learning" by Dr. Kai Yu (余凯)[Video]· CNN - Convolutional neural network class[Matlab Tool]· Yann LeCun's Publications[Wedsite]· LeNet-5, convolutional neural networks[Project]· Training a deep autoencoder or a classifier on MNIST digits[Project]· Deep Learning 大牛Geoffrey E. Hinton's HomePage[Website]· Multiple Instance Logistic Discriminant-based Metric Learning (MildML) and Logistic Discriminant-based Metric Learning (LDML)[Code]· Sparse coding simulation software[Project]· Visual Recognition and Machine Learning Summer School[Software]十一、目标、行为识别Object, Action Recognition:·Action Recognition by Dense Trajectories[Project][Code]·Action Recognition Using a Distributed Representation of Pose and Appearance[Project]·Recognition Using Regions[Paper][Code]·2D Articulated Human Pose Estimation[Project]·Fast Human Pose Estimation Using Appearance and Motion via Multi-Dimensional Boosting Regression[Paper][Code]·Estimating Human Pose from Occluded Images[Paper][Code]·Quasi-dense wide baseline matching[Project]· ChaLearn Gesture Challenge: Principal motion: PCA-based reconstruction of motion histograms[Project]· Real Time Head Pose Estimation with Random Regression Forests[Project]· 2D Action Recognition Serves 3D Human Pose Estimation[Project]· A Hough Transform-Based Voting Framework for Action Recognition[Project]·Motion Interchange Patterns for Action Recognition in Unconstrained Videos[Project]·2D articulated human pose estimation software[Project]·Learning and detecting shape models [code]·Progressive Search Space Reduction for Human Pose Estimation[Project]·Learning Non-Rigid 3D Shape from 2D Motion[Project]十二、图像处理:· Distance Transforms of Sampled Functions[Project]· The Computer Vision Homepage[Project]· Efficient appearance distances between windows[code]· Image Exploration algorithm[code]· Motion Magnification 运动放大[Project]· Bilateral Filtering for Gray and Color Images 双边滤波器[Project]· A Fast Approximation of the Bilateral Filter using a Signal Processing Approach [Project]十三、一些实用工具:·EGT: a Toolbox for Multiple View Geometry and Visual Servoing[Project] [Code]· a development kit of matlab mex functions for OpenCV library[Project]·Fast Artificial Neural Network Library[Project]十四、人手及指尖检测与识别:· finger-detection-and-gesture-recognition [Code]· Hand and Finger Detection using JavaCV[Project]· Hand and fingers detection[Code]十五、场景解释:· Nonparametric Scene Parsing via Label Transfer [Project]十六、光流Optical flow:· High accuracy optical flow using a theory for warping [Project]· Dense Trajectories Video Description [Project]·SIFT Flow: Dense Correspondence across Scenes and its Applications[Project]·KLT: An Implementation of the Kanade-Lucas-Tomasi Feature Tracker [Project]·Tracking Cars Using Optical Flow[Project]·Secrets of optical flow estimation and their principles[Project]·implmentation of the Black and Anandan dense optical flow method[Project]·Optical Flow Computation[Project]·Beyond Pixels: Exploring New Representations and Applications for Motion Analysis[Project] · A Database and Evaluation Methodology for Optical Flow[Project]·optical flow relative[Project]·Robust Optical Flow Estimation [Project]·optical flow[Project]十七、图像检索Image Retrieval:· Semi-Supervised Distance Metric Learning for Collaborative Image Retrieval [Paper][code]十八、马尔科夫随机场Markov Random Fields:·Markov Random Fields for Super-Resolution [Project]· A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness-Based Priors [Project]十九、运动检测Motion detection:· Moving Object Extraction, Using Models or Analysis of Regions [Project]·Background Subtraction: Experiments and Improvements for ViBe [Project]· A Self-Organizing Approach to Background Subtraction for Visual Surveillance Applications [Project] ·: A new change detection benchmark dataset[Project]·ViBe - a powerful technique for background detection and subtraction in video sequences[Project] ·Background Subtraction Program[Project]·Motion Detection Algorithms[Project]·Stuttgart Artificial Background Subtraction Dataset[Project]·Object Detection, Motion Estimation, and Tracking[Project]。
Python中的计算机视觉和目标检测算法
Python中的计算机视觉和目标检测算法计算机视觉是人工智能领域的一个重要研究方向,它旨在使计算机通过对图像和视频的分析和理解,实现对场景、对象和行为的认知。
而目标检测则是计算机视觉中的一个重要任务,它旨在从图像或视频中快速准确地定位和识别特定的对象和目标。
Python作为一种简单易学且功能强大的编程语言,广泛应用于计算机视觉和目标检测算法的开发和实践中。
一、Python在计算机视觉中的应用Python在计算机视觉领域有着广泛的应用,它提供了许多强大的库和工具,方便开发人员进行图像和视频处理、特征提取、模式识别等任务。
以下是Python在计算机视觉中的常用库和工具:1. OpenCVOpenCV是一种开源的计算机视觉库,广泛应用于图像处理和分析领域。
它提供了丰富的图像处理算法和函数,支持图像的读取、显示、保存,以及边缘检测、图像匹配、特征提取等功能。
通过Python与OpenCV的结合,我们可以方便地实现图像处理任务,并进行目标检测、跟踪等应用。
2. scikit-imagescikit-image是一个基于NumPy的Python图像处理库,它提供了一系列用于图像处理和分析的函数和工具。
scikit-image具有简单易用的API和丰富的图像处理功能,例如灰度化、二值化、图像滤波、边缘检测等。
在计算机视觉的实践中,scikit-image可以与其他库和工具结合使用,实现各种图像处理任务。
3. PIL/PillowPIL(Python Imaging Library)是Python中常用的图像处理库,而Pillow是PIL的一个分支版本,提供了更多的功能和改进。
Pillow可以实现图像的打开、保存、缩放、旋转等操作,还支持图像模式的转换、图像特效的添加等功能。
在计算机视觉领域,Pillow可以方便地用于图像的预处理和增强等任务。
4. MatplotlibMatplotlib是Python中常用的绘图库,可以绘制各种类型的2D图像,例如线图、散点图、柱状图等。
公开目标检测数据集
公开目标检测数据集
公开的目标检测数据集有很多,以下是一些常见的公开目标检测数据集:
1. ImageNet:这是一个非常著名的计算机视觉数据集,包含超过1400万
张带有注释的图像,主要用于分类、定位和目标检测任务。
该数据集中的图像覆盖了上千个类别,被广泛应用于训练各种计算机视觉模型。
2. PASCAL VOC:这是一个常用于目标检测和图像分割的数据集,包含多
个年份的数据集,其中每个图像都标注了多个对象类别。
PASCAL VOC数
据集提供了丰富的标注信息,可用于训练各种目标检测和图像分割模型。
3. COCO:这是一个大型的、多功能的计算机视觉数据集,主要用于目标检测、图像分割和关键点检测等任务。
COCO数据集包含超过30万张带有注释的图像,覆盖了80个类别,被广泛应用于训练各种计算机视觉模型。
4. Open Images:这是一个大型的、开放式的计算机视觉数据集,包含了
超过900万张带有注释的图像,覆盖了600个类别。
该数据集的注释信息
非常丰富,包括边界框、遮罩、关键点等,可用于训练各种计算机视觉模型。
5. YOLOv3:这是一个用于目标检测的开源数据集,包含了多个不同场景下的图像,如自然环境、城市街道、运动场景等。
该数据集对每个目标都标注了边界框和类别信息,可用于训练各种目标检测模型。
以上是一些常见的公开目标检测数据集,每个数据集都有自己的特点和用途。
选择适合自己任务的数据集,对于训练出高效的目标检测模型至关重要。
实用的计算机视觉开发工具与库推荐
实用的计算机视觉开发工具与库推荐计算机视觉(Computer Vision)是研究如何让计算机具备"看"的能力以及如何理解和解释图像和视频的领域。
随着人工智能技术的发展,计算机视觉在各个领域中发挥着重要作用,包括自动驾驶、人脸识别、图像检测等。
在计算机视觉的开发过程中,使用合适的工具与库可以提高开发效率和准确性。
本文将为大家推荐一些实用的计算机视觉开发工具与库。
1. OpenCVOpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件库。
它提供了丰富的图像处理和计算机视觉算法,包括图像滤波、特征检测、目标跟踪等。
OpenCV支持多种编程语言,包括C++、Python、Java等,使得开发者可以根据自己的需求方便地进行开发。
通过使用OpenCV,开发者可以快速实现各种计算机视觉任务,并利用其强大的图像处理算法提高准确性。
2. TensorFlowTensorFlow是由Google开发的一个开源机器学习框架,提供了丰富的功能和工具,支持各种机器学习和深度学习应用。
TensorFlow中的高级API包括Keras和tf.keras,可以用于计算机视觉任务的开发。
它提供了各种预训练模型和算法,如图像分类、目标检测、语义分割等。
使用TensorFlow进行计算机视觉开发可以极大地简化开发流程,提高开发效率。
3. PyTorchPyTorch是一个基于Python的开源机器学习框架,具有动态计算图的特点,易于使用且灵活性强。
PyTorch提供了丰富的计算机视觉相关的库和工具,如torchvision,其中包含了许多用于图像处理和计算机视觉任务的预训练模型和数据集。
PyTorch还支持快速开发的库,如fastai,可以帮助开发者快速搭建和训练计算机视觉模型。
4. MATLABMATLAB是一种用于科学计算、可视化和程序设计的高级语言和环境。
目标检测常用数据集
目标检测常用数据集目标检测是计算机视觉中的一个重要任务,它的目标是在给定图像中检测和定位不同类别的物体。
为了训练和评估目标检测算法的性能,研究人员和开发者通常使用一些常用的数据集。
本文将介绍一些目标检测常用数据集,并分析其特点和应用场景。
1. COCO数据集(Common Objects in Context):COCO数据集是一个大规模的目标检测、分割和关键点检测数据集,包含超过33万个图像和超过80个不同类别的物体。
该数据集具有多样性和复杂性,图像中物体的大小、形状和姿态变化较大。
COCO数据集常被用于评估新的目标检测算法的性能,并推动了深度学习在目标检测领域的发展。
2. Pascal VOC数据集:Pascal VOC数据集是一个经典的目标检测数据集,包含20个不同的物体类别,如人、车、猫等。
该数据集共有接近2万个标注的图像,适用于模型的训练和评估。
Pascal VOC数据集的一个特点是其目录结构清晰,标注信息丰富,因此被广泛应用于目标检测算法的研究和比较。
3. ImageNet数据集:ImageNet数据集是一个大规模的图像数据库,包含超过1500万张图像,涵盖200个不同类别的物体。
该数据集主要用于图像分类任务,但也被广泛应用于目标检测领域。
ImageNet数据集的一个特点是其数据量庞大,能够提供丰富的视觉信息,有助于训练更准确和鲁棒的目标检测模型。
4. KITTI数据集:KITTI数据集是一个专为自动驾驶研究开发的目标检测数据集。
该数据集包括城市场景中的图像、激光雷达和相机数据,用于车辆检测、行人检测和三维物体重建等任务。
KITTI数据集的一个特点是其真实性和复杂性,可以帮助研究人员和开发者针对自动驾驶场景进行目标检测算法的开发和评估。
5. Open Images数据集:Open Images数据集是一个由Google开源的大规模图像数据集,包含超过900万张图像和超过3万个不同类别的物体。
矿产
矿产资源开发利用方案编写内容要求及审查大纲
矿产资源开发利用方案编写内容要求及《矿产资源开发利用方案》审查大纲一、概述
㈠矿区位置、隶属关系和企业性质。
如为改扩建矿山, 应说明矿山现状、
特点及存在的主要问题。
㈡编制依据
(1简述项目前期工作进展情况及与有关方面对项目的意向性协议情况。
(2 列出开发利用方案编制所依据的主要基础性资料的名称。
如经储量管理部门认定的矿区地质勘探报告、选矿试验报告、加工利用试验报告、工程地质初评资料、矿区水文资料和供水资料等。
对改、扩建矿山应有生产实际资料, 如矿山总平面现状图、矿床开拓系统图、采场现状图和主要采选设备清单等。
二、矿产品需求现状和预测
㈠该矿产在国内需求情况和市场供应情况
1、矿产品现状及加工利用趋向。
2、国内近、远期的需求量及主要销向预测。
㈡产品价格分析
1、国内矿产品价格现状。
2、矿产品价格稳定性及变化趋势。
三、矿产资源概况
㈠矿区总体概况
1、矿区总体规划情况。
2、矿区矿产资源概况。
3、该设计与矿区总体开发的关系。
㈡该设计项目的资源概况
1、矿床地质及构造特征。
2、矿床开采技术条件及水文地质条件。
矿产
矿产资源开发利用方案编写内容要求及审查大纲
矿产资源开发利用方案编写内容要求及《矿产资源开发利用方案》审查大纲一、概述
㈠矿区位置、隶属关系和企业性质。
如为改扩建矿山, 应说明矿山现状、
特点及存在的主要问题。
㈡编制依据
(1简述项目前期工作进展情况及与有关方面对项目的意向性协议情况。
(2 列出开发利用方案编制所依据的主要基础性资料的名称。
如经储量管理部门认定的矿区地质勘探报告、选矿试验报告、加工利用试验报告、工程地质初评资料、矿区水文资料和供水资料等。
对改、扩建矿山应有生产实际资料, 如矿山总平面现状图、矿床开拓系统图、采场现状图和主要采选设备清单等。
二、矿产品需求现状和预测
㈠该矿产在国内需求情况和市场供应情况
1、矿产品现状及加工利用趋向。
2、国内近、远期的需求量及主要销向预测。
㈡产品价格分析
1、国内矿产品价格现状。
2、矿产品价格稳定性及变化趋势。
三、矿产资源概况
㈠矿区总体概况
1、矿区总体规划情况。
2、矿区矿产资源概况。
3、该设计与矿区总体开发的关系。
㈡该设计项目的资源概况
1、矿床地质及构造特征。
2、矿床开采技术条件及水文地质条件。
矿产
矿产资源开发利用方案编写内容要求及审查大纲
矿产资源开发利用方案编写内容要求及《矿产资源开发利用方案》审查大纲一、概述
㈠矿区位置、隶属关系和企业性质。
如为改扩建矿山, 应说明矿山现状、
特点及存在的主要问题。
㈡编制依据
(1简述项目前期工作进展情况及与有关方面对项目的意向性协议情况。
(2 列出开发利用方案编制所依据的主要基础性资料的名称。
如经储量管理部门认定的矿区地质勘探报告、选矿试验报告、加工利用试验报告、工程地质初评资料、矿区水文资料和供水资料等。
对改、扩建矿山应有生产实际资料, 如矿山总平面现状图、矿床开拓系统图、采场现状图和主要采选设备清单等。
二、矿产品需求现状和预测
㈠该矿产在国内需求情况和市场供应情况
1、矿产品现状及加工利用趋向。
2、国内近、远期的需求量及主要销向预测。
㈡产品价格分析
1、国内矿产品价格现状。
2、矿产品价格稳定性及变化趋势。
三、矿产资源概况
㈠矿区总体概况
1、矿区总体规划情况。
2、矿区矿产资源概况。
3、该设计与矿区总体开发的关系。
㈡该设计项目的资源概况
1、矿床地质及构造特征。
2、矿床开采技术条件及水文地质条件。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
以下是computer vision:algorithm and application计算机视觉算法与应用这本书中附录里的关于计算机视觉的一些测试数据集和源码站点,我整理了下,加了点中文注解。
Computer Vision:Algorithms and ApplicationsRichard Szeliski在本书的最好附录中,我总结了一些对学生,教授和研究者有用的附加材料。
这本书的网址/Book包含了更新的数据集和软件,请同样访问他。
C.1 数据集一个关键就是用富有挑战和典型的数据集来测试你算法的可靠性。
当有背景或者他人的结果是可行的,这种测试可能甚至包含更多的信息(和质量更好)。
经过这些年,大量的数据集已经被提出来用于测试和评估计算机视觉算法。
许多这些数据集和软件被编入了计算机视觉的主页。
一些更新的网址,像CV online(/rbf/CV online), (/), and Computer Vision online (/ ), 有更多最新的数据集和软件。
下面,我列出了一些用的最多的数据集,我将它们让章节排列以便它们联系更紧密。
第二章:图像信息CUReT: Columbia-Utrecht 反射率和纹理数据库Reflectance and Texture Database, /CA VE/software/curet/(Dana, van Ginneken, Nayar et al. 1999).Middlebury Color Datasets:不同摄像机拍摄的图像,注册后用于研究不同的摄像机怎么改变色域和彩色registered color images taken by different cameras to study how they transform gamuts and colors, /color/data/Chakrabarti, Scharstein, and Zickler 2009).第三章:图像处理Middlebury test datasets for evaluating MRF minimization/inference algorithms评估隐马尔科夫随机场最小化和推断算法,/MRF/results/ (Szeliski, Zabih, Scharstein et al. 2008).第四章:特征检测和匹配Affine Covariant Features database(反射协变的特征数据集)for evaluating feature detector and descriptor matching quality and repeatability(评估特征检测和描述匹配的质量和定位精度), /~vgg/research/affine/(Miko-lajczyk and Schmid 2005; Mikolajczyk, Tuytelaars, Schmid et al. 2005).Database of matched image patches for learning (图像斑块匹配学习数据库)and feature descriptor evaluation(特征描述评估数据库),http://cvlab.epfl.ch/~brown/patchdata/patchdata.html(Winder and Brown 2007; Hua,Brown, and Winder 2007).第五章;分割Berkeley Segmentation Dataset(分割数据库)and Benchmark of 1000 images labeled by 30 humans,(30个人标记的1000副基准图像)along with an evaluation,/Research/Projects/CS/vision/grouping/segbench/(Martin, Fowlkes, Tal et al. 2001).Weizmann segmentation evaluation database of 100 grayscale images with ground truth segmentations,http://www.wisdom.weizmann.ac.il/~vision/Seg Evaluation DB/index.html(Alpert, Galun, Basri et al. 2007).第八章:稠密运动估计The Middlebury optic flow evaluation(光流评估)Web site,/flow/data/(Baker, Scharstein, Lewis et al. 2009).The Human-Assisted Motion Annotation database,(人类辅助运动数据库)/celiu/motionAnnotation/(Liu, Freeman, Adelson et al. 2008)第十章:计算机摄像学High Dynamic Range radiance(辐射)maps, /Research/HDR/(De-bevec and Malik 1997).Alpha matting evaluation Web site, / (Rhemann, Rother, Wanget al. 2009).第十一章:Stereo correspondence立体对应Middlebury Stereo Datasets and Evaluation, /stereo/(Scharstein and Szeliski 2002).Stereo Classification(立体分类)and Performance Evaluation(性能评估)of different aggregation(聚类)costs for stereo matching(立体匹配),http://www.vision.deis.unibo.it/spe/SPEHome.aspx(Tombari, Mat-toccia, Di Stefano et al. 2008).Middlebury Multi-View Stereo Datasets,/mview/data/(Seitz,Curless, Diebel et al. 2006).Multi-view and Oxford Colleges building reconstructions,/~vgg/data/data-mview.html .Multi-View Stereo Datasets, http://cvlab.epfl.ch/data/strechamvs/(Strecha, Fransens,and Van Gool 2006).Multi-View Evaluation, http://cvlab.epfl.ch/~strecha/multiview/ (Strecha, von Hansen,Van Gool et al. 2008).第十二章:3D重建HumanEva: synchronized video(同步视频)and motion capture (动作捕捉)dataset for evaluation of articulated human motion, /humaneva/Sigal, Balan, and Black 2010).第十三章:图像渲染The (New) Stanford Light Field Archive, /(Wilburn, Joshi,Vaish et al. 2005).Virtual Viewpoint Video: multi-viewpoint video with per-frame depth maps,/en-us/um/redmond/groups/ivm/vvv/(Zitnick, Kang, Uytten- daele et al. 2004).第十四章:识别查找一系列的视觉识别数据库,在表14.1–14.2.除了那些,这里还有:Buffy pose classes, /~vgg/data/buffy pose classes/ and Buffy stickmen V2.1, /~vgg/data/stickmen/index.html(Ferrari,Marin- Jimenez, and Zisserman 2009; Eichner and Ferrari 2009).H3D database of pose/joint annotated photographs of humans,/~lbourdev/h3d/(Bourdev and Malik 2009).Action Recognition Datasets, /projects/vision/action, has point-ers to several datasets for action and activity recognition, as well as some papers.(有一些关于人活动和运动的数据库和论文)The human action database athttp://www.nada.kth.se/cvap/actions/包含更多的行动序列。
C.2 软件资源一个对于计算机视觉算法最好的资源就是开源视觉图像库(opencv)(/wiki/),他有在intel的Gary Bradski和他的同事开发,现在由Willow Garage (Bradsky and Kaehler 2008)维护和扩展。
一部分可利用的函数在/documentation/cpp/中:图像处理和变换(滤波,形态学,金字塔);图像几何学的变换(旋转,改变大小);混合图像变换(傅里叶变换,距离变换);直方图;分割(分水岭, mean shift);特征检测(Canny, Harris, Hough, MSER, SURF);运动分析和物体分析(Lucas–Kanade, mean shift);相机矫正和3D重建机器学习(k nearest neighbors, 支持向量机, 决策树, boost-ing, 随机树, expectation-maximization, 和神经网络).Intel的Performance Primitives (IPP) library, /en-us/intel-ipp/,包含各种各样的图像处理任务的最佳优化代码,许多opencv中的例子利用了这个库,加入他安装了,程序运行得更快。