基础知识
当前位置:首页 > 公文写作 > 基础知识 > 列表页

计算机视觉基础论文

小草范文网  发布于:2017-04-11  分类: 基础知识 手机版

篇一:基于OpenCV的计算机视觉技术研究与实现毕业论文

目 录

摘 要 ....................................................... III Abstract ...................................................... IV

引 言 ......................................................... 1

第一章 绪 论 ................................................... 2

1.1 系统开发背景 ...................................................... 2

1.2 计算机视觉技术发展的历程 .......................................... 2

1.3 计算机视觉图像分析技术 ............................................ 3

1.4 计算机视觉国内外研究现状 .......................................... 3

1.5 系统开发环境 ...................................................... 4

第二章 定位与跟踪视线范围内运动状态物体方法 .................... 6

2.1 定位视线内运动状态物体的方法 ...................................... 6

2.1.1 常见的传统检测方法 .......................................... 6

2.1.2 高斯混合背景建模法 .......................................... 7

2.1.3 codebook算法................................................ 8

2.2 跟踪视线内运动状态物体的方法 ...................................... 8

2.2.1 基于光流跟踪算法 ............................................ 8

2.2.2 卡尔曼跟踪算法 .............................................. 9

2.2.3 粒子滤波跟踪算法 ........................................... 10

2.2.4 长时间跟踪TLD算法 ......................................... 12

2.2.5 压缩感知跟踪(CT跟踪)..................................... 12

第三章 软件平台 ............................................... 14

3.1 OpenCV简介 ...................................................... 14

3.2 OpenCV中常用数据结构体系 ........................................ 15

第四章 图像处理 ............................................... 17

4.1 彩色图像灰度化处理 ............................................... 17

4.2 中值滤波处理 ..................................................... 18

4.2.1 中值滤波原理 ............................................... 18

4.2.2 中值滤波特性 ............................................... 18

4.3 二值化处理 ....................................................... 19

4.4 腐蚀与膨胀处理 ................................................... 20

4.5 开运算和闭运算处理 ............................................... 22

第五章 混合高斯模型与压缩感知跟踪算法原理详解 ................. 24

5.1 混合高斯模型原理 ................................................. 24

5.1.1 混合高斯模型的建立 ......................................... 24

5.1.2 混合高斯背景模型的更新 ..................................... 26

5.1.3混合高斯背景模型算法的优缺点................................ 26

5.2 压缩感知跟踪(Compressive Tracker) .............................. 27

5.2.1 压缩感知跟踪概述 ........................................... 27

5.2.2 压缩感知跟踪的相关理论推导 ................................. 27

5.2.3 压缩跟踪算法 ............................................... 31

第六章 系统实现与结果 ......................................... 32

6.1 视线检测的实现与结果 ............................................. 32

6.2 视线追踪的实现与结果 ............................................. 34

结束语 ........................................................ 37

参考文献 ...................................................... 38

致 谢 ........................................................ 39

附 录 ........................................................ 40

摘 要

计算机视觉技术就是利用了摄像机以及电脑拥有人类双眼所具有的分类、识别、追踪、判别决策等视觉功能。计算机视觉系统就是创建了能够在平面图像或者三维立体图像的数据中,以获取需要的信息的一个完整的人工智能系统。本文在研究了计算机视觉技术的基础上,针对于运动目标检测与跟踪在未来的发展,提出了一套基于OpenCV视觉库的检测、跟踪视线范围内动态物体的检测系统,以达到模拟人眼的识别、追踪、分类功能。动态目标检测与跟踪作为计算机视觉领域的一个重要部分,在工业、医疗保健、航空航天、军事等各个领域具有广泛的应用前景,一直受到广泛的关注,并成为计算机视觉领域的研究热点。本文在现有研究成果的基础上,对静态和动态场景下的运动目标检测与跟踪进行了深入的讨论。

本文总结了计算机视觉技术的国内外发展的现状,深入研究了计算机视觉技术、图像分析处理技术、动态检测技术等相关资料。

详细阐述了基于OpenCV的计算机视觉技术的动态物体检测系统的设计方案、工作原理、以及实现。其中着重讨论混合高斯背景模型与压缩感知算法的C++代码设计(结合OpenCV库)的实现,并通过采样视频给出了程序的运行结果以及说明算法的可行性

关键词:计算机视觉,目标检测,OpenCV,混合高斯背景模型

Abstract

Computer vision technology is the use of cameras and computer withclassification, human eyes have identification, tracking, visual function ofdecision. A computer vision system is created in the graphic or three-dimensional image data, to a complete artificial intelligence system to obtain required information. Based on the study of the computer vision technology, for moving target detection and tracking in the future development, and put forward a set ofdetection, detection system based on the OpenCV library visual tracking dynamicobjects within sight of, recognition, in order to simulate human tracking,classification function. Dynamic target detection and tracking is an important partin the field of computer vision, which has wide application prospect in the fields of industrial, medical, aerospace, military, has received the widespread attention,and becomes a hotspot in the field of computer vision. In this paper, based on the existing research results, the static and dynamic scenes of moving targetdetection and tracking is deeply discussed.

This paper summarizes the current situation of the development of computervision technology at home and abroad, in-depth study of the computer vision technology, image processing technology, the dynamic detection technology and other relevant information.

Expounds design, dynamic object detection system of computer vision technology OpenCV's working principle, and the realization based on. With the emphasis on the C++ code design of mixed Gauss background model and compressed sensing algorithm (with OpenCV Library) implementation, and by sampling the video gives running result of program and the feasibility that algorithm.

Keywords: computer vision, moving object detection, OpenCV, mixed Gauss background model

篇二:计算机视觉论文

中国矿业大学公选课

计算机视觉论文

学院:计算机科学与技术

班级:信安10-2

姓名:吴健东

学号:08103695

2011年10月

(一)引言:

计算机视觉是人工智能领域的一个重要部分,它的研究目标是使计算机具有通过二维图像认知三维环境信息的视觉是以图象处理技术、信号处理技术、概率统计分析、计算几何、神经网络、机器学习理论和计算机信息处理技术等计算机分析与处理视觉信息。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维信息的人工系统。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中有计算机学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。计算机视觉也是当前计算机科学中的一领域,计算机视觉领域与图像处理,模式识别,投影几何,统计推断,统计学习等学科密切相关,近年来,与计算机图形等学科也发生了很强的联系。

(二)应用: 人类正在进入信息时代,计算机将越来越广泛地进入几乎所有领域。一方面是更多未经计算机专业训练的人也需要应用计算机,而另一方面是计算机的功能越来越强,使用方法越来越复杂。这就使人在进行交谈和通讯时的灵活性与目前在使用计算机时所要求的严格和死板之间产生了尖锐的矛盾。人可通过视觉和听觉,语言与外界交换信息,并且可用不同的方式表示相同的含义,而目前的计算机却要求严格按照各种程序语言来编写程序,只有这样计算机才能运行。为使更多的人能使用复杂的计算机,必须改变过去的那种让人来适应计算机,来死记硬背计算机的使用规则的情况。而是反过来让计算机来适应人的习惯和要求,以人所习惯的方式与人进行信息交换,也就是让计算机具有视觉、听觉和说话等能力。这时计算机必须具有逻辑推理和决策的能力。具有上述能力的计算机就是智能计算机。

计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,目前还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,目前人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理。但是,人类视觉系统是迄今为止,人们所知道的功能最强大和完善的视觉系统。如在以下的章节中会看到的那样,对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。因此,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,也是一个非常重要和信人感兴趣的研究领域。这方面的研究被称为计算视觉。计算视觉可被认为是计算机视觉中的一个研究领域。 有不少学科的研究目标与计算机视觉相近或与此有关。这些学科中包括图象处理、模式识别或图象识别、景物分析、图象理解等。由于历史发展或领域本身的特点这些学科互有差别,但又有某种程度的相互重叠。

(三)技术:

有不少学科的研究目标与计算机视觉相近或与此有关。这些学科中包括图象处理、模式识别或图象识别、景物分析、图象理解等。由于历史发展或领域本身的特点这些学科互有差别,但又有某种程度的相互重叠。

图象处理

图象处理技术把输入图象转换成具有所希望特性的另一幅图象。例如,可通过处理使输出图象有较高的信-噪比,或通过增强处理突出图象的细节,以便于操作员的检验。在计算机视觉研究中经常利用图象处理技术进行预处理和特征抽取。

模式识别

模式识别技术根据从图象抽取的统计特性或结构信息,把图象分成予定的类别。例如,文字识别或指纹识别。在计算机视觉中模式识别技术经常用于对图象中的某些部分,例如分割区域的识别和分类。

图象理解

给定一幅图象,图象理解程序不仅描述图象本身,而且描述和解释图象所代表的景物,以便对图象代表的内容作出决定。在人工智能视觉研究的初期经常使用景物分析这个术语,以强调二维图象与三维景物之间的区别。图象理解除了需要复杂的图象处理以外还需要具有关于景物成象的物理规律的知识以及与景物内容有关的知识。

在建立计算机视觉系统时需要用到上述学科中的有关技术,但计算机视觉研究的内容要比这些学科更为广泛。计算机视觉的研究与人类视觉的研究密切相关。为实现建立与人的视觉系统相类似的通用计算机视觉系统的目标需要建立人类视觉的计算机理论。

(四)问题: 几乎在每个计算机视觉技术的具体应用都要解决一系列相同的问题。这些经典的问题包括:

识别

一个计算机视觉,图像处理和机器视觉所共有的经典问题便是判定一组图像数据中是否包含某个特定的物体,图像特征或运动状态。这一问题通常可以通过机器自动解决,但是到目前为止,还没有某个单一的方法能够广泛的对各种情况进行判定:在任意环境中识别任意物体。现有技术能够也只能够很好地解决特定目标的识别,比如简单几何图形识别,人脸识别,印刷或手写文件识别或者车辆识别。而且这些识别需要在特定的环境中,具有指定的光照,背景和目标姿态要求。

广义的识别在不同的场合又演化成了几个略有差异的概念:

识别(狭义的):对一个或多个经过预先定义或学习的物体或物类进行辨识,通常在辨识过程中还要提供他们的二维位置或三维姿态。

鉴别:识别辨认单一物体本身。例如:某一人脸的识别,某一指纹的识别。 监测:从图像中发现特定的情况内容。例如:医学中对细胞或组织不正常技能的发现,交通监视仪器对过往车辆的发现。监测往往是通过简单的图象处理发现图像中的特殊区域,为后继更复杂的操作提供起点。

识别的几个具体应用方向:

基于内容的图像提取:在巨大的图像集合中寻(本文来自:wwW.xIAocAofaNwEn.com 小 草范 文 网:计算机视觉基础论文)找包含指定内容的所有图片。被指定的内容可以是多种形式,比如一个红色的大致是圆形的图案,或者一辆自行车。在这里对后一种内容的寻找显然要比前一种更复杂,因为前一种描述的是一个低级直观的视觉

特征,而后者则涉及一个抽象概念(也可以说是高级的视觉特征),即‘自行车’,显然的一点就是自行车的外观并不是固定的。

姿态评估:对某一物体相对于摄像机的位置或者方向的评估。例如:对机器臂姿态和位置的评估。

光学字符识别对图像中的印刷或手写文字进行识别鉴别,通常的输出是将之转化成易于编辑的文档形式。

运动

基于序列图像的对物体运动的监测包含多种类型,诸如:

自体运动:监测摄像机的三维刚性运动。

图像跟踪:跟踪运动的物体。

场景重建

给定一个场景的二或多幅图像或者一段录像,场景重建寻求为该场景建立一个计算机模型/三维模型。最简单的情况便是生成一组三维空间中的点。更复杂的情况下会建立起完整的三维表面模型。

图像恢复

图像恢复的目标在于移除图像中的噪声,例如仪器噪声,模糊等。

(五)趋势:

计算机视觉是在20世纪50年代从统计模式识别开始的.当时的工作主要集中在二维图像分析和识别上,如光学件表面、显微图片和航空图片的分析和解释等.60年代,Roberts(1965)通过计算机程序从数字图像中提取出诸如立方体柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述[Roberts 1965]。70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“机器视觉”由国际著名学者B.K.P.Hom教授讲授。80年代以来,计算机视觉的研究已经历r从实验室走向实际应用的发展阶段。水平的飞速提高以及人工智能、并行处理和神经元网络等学科的发展,更促进了计算机视觉系统的实用化和涉足许程的研究。目前,计算机视觉技术正在广泛她应用于计算几何、计算机图形学、图像处理、机器入学等多个领域中。

(六)结论:

通过计算机视觉这门课程的学习,作为学习计算机的我来说无疑是一次很大的收获。结合我的专业,让我对我说学的东西又有了深刻的认识。希望自己在今后的专业学习中能够有更大的进步和收获。

参考文献:

张颂德 张正友 《计算机视觉》科学出版社 1998

篇三:计算机视觉论文

计算机视觉(computer vision)论文

学院:信息科学与工程学院

摘要:计算机视觉学是自二十世纪六十年代中期迅速发展起来的一门新学科。它是个边缘学科,集众家之所长,是个工程性很强的技术,主要需要有空间几何、矩阵分析、光电技术、图像处理、应用数学、离散数学及计算机技术等等各个方面的知识,才能正确的指导视觉系统的建模、解模及实际工程问题的解决方法。计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样。本文简要地介绍了计算机视觉学同附近学科的关系,计算机视觉研究中面临的技术难点需要解决的问题以及计算机视觉学的历史,现状和研究动向。

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别 、跟踪和测量等,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。

图像分割与图像处理与计算机视觉有很大联系。其研究对象主要是二维图像,实现图像的转化,尤其针对像素级的操作,例如提高图像对比度,边缘提取,去噪声和几何变换如图像旋转。这一特征表明无论是图像处理还是图像分析其研究内容都和图像的具体内容无关。

模式识别与计算机视觉也有莫大联系。根据从图像中抽取的统计特性或结构信息,把图像分成预定的类别。例如,文字识别或指纹识别。在计算机视觉中模式识别技术经常用于对图像中的某些部分,例如分割区域的识别和分类。

物理学和光学同样和计算机视觉有很大的联系。计算机视觉关注的目标在于充分理解电磁波,主要是可见光与红外线部分,遇到物体表面被反射所形成的图像,而这一过程便是基于光学物理和固态物理,一些尖端的图像感知系统甚至会应用到量子力学理论,来解析影像所表示的真实世界。由此,计算机视觉同样可以被看作是物理学的拓展。

除上面介绍的之外还有神经生物学即生物视觉。在整个20世纪中,人类对各种动物的眼睛、神经元、以及与视觉刺激相关的脑部组织都进行了广泛研究,这些研究得出了一些有关“天然的”视觉系统如何运作的描述(尽管仍略嫌粗略),这也形成了计算机视觉中的一个子领域——人们试图建立人工系统,使之在不同的复杂程度上模拟生物的视觉运作。同时计算机视觉领域中,一些基于机器学习的方法也有参考部分生物机制。另外它与信号分析与处理,数学统计,最优理论,几何,粒度,心理学,美学,集成电路??也有不可或缺的联系。

计算机视觉需要解决的问题有一下几个:一是:识别(识别,鉴别,监测)。判定一组图像数据中是否包含某个特定的物体,图像特征或运动状态。到目前为止,还没有某个单一的方法能够广泛的对各种情况进行判定:在任意环境中识别任意物体。现有技术能够也只能够很好地解决特定目标的识别,比如简单几何图形识别,人脸识别,印刷或手写文件识别或者车辆识别。而且这些识别需要在特定的环境中,具有指定的光照,背景和目标姿态要求。二是:运动。包括:自体运动:摄像机/成像设备的三维刚性运动(全局运动)。图像跟踪:跟踪运动的物体(车辆轨迹跟踪 、人员计数演示)。三是:场景重建。给定一个场景的二或多幅图像或者一段录像,场景重建寻求为该场景建立一个计算机模型或三维模型。四是:图像恢复。图像恢复的目标在于移除图像中的噪声,例如仪器噪声,模糊等。

计算机视觉的发展是从二十世纪五十年代开始,六十年代开始快速发展。20世纪50年代归入模式识别----主要集中在二维图像分析和识别上,如,光学字符识别,工件表面、显微图片和航空图片的分析和解释等.60年代MIT 的Roberts通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述.Roberts 的研究工作开创了以理解三维场景为目的的三维计算机视觉的研究。Roberts对积木世界的创造性研究给人们以极大的启发,许多人相信,一旦由白色积木玩具组成的三维世界可以被理解,则可以推广到理解更复杂的三维场景.70年代,已经出现了一些视觉应用系统.70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“计算机视觉” ( Machine Vision) 课程,由B.K.P.Horn教授讲授.研究热潮是从 20世纪80年代开始的,到了80年代中期,计算机视觉获得了蓬勃发展,新概念、新方法、新理论不断涌现,比如,基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等。

从以往的研究看,过去的几十年虽然提出、解决了一些问题,但是由于视觉问题的特殊性和复杂性,还有大量的问题需要研究。研究的重点包括对新方法、新手段的探索。当然,在原有问题上采用新的描述方法、求解手段也是一个可能的突破点。在视觉领域中多数的问题不是问题本身正确与否,而是描述是否恰当以及求解是否有效的问题,因而描述方式、求解手段的探索是十分重要的。总之,随着对定量研究的重视,新的描述方式、求解手段的研究,以及感知手段的改进,计算机视觉的研究必将迎来一个更加繁荣的时代。

本文已影响