公务员期刊网 精选范文 计算机视觉技术范文

计算机视觉技术精选(九篇)

计算机视觉技术

第1篇:计算机视觉技术范文

关键词:OpenCV;计算机视觉技术;三维模拟技术

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2015)30-0137-02

21世纪是国际计算机技术高度发展的时代,人们生活中的每个角落都可以看到计算机技术的身影,尤其是现代计算机视觉技术和图像处理功能发展更加迅猛,各技术分支也逐渐趋于成熟。计算机视觉技术主要指的就是利用智能计算机系统来代替人类的眼睛对现实三维世界进行辨识和理解,整个过程均是计算机自我学习的过程,而随着这项技术研究的不断深入,其不再仅仅包含计算机技术科学,同时还涉猎了包括生理学、神经学、物理学、应用数学等多门学科,为人类科技的进步提供了有效的动力。

1 计算机对视频中运动物体检测的原理概述

在现代计算机技术基础下,对视频当中的运动物体检测原理主要包括两种,分别是从微观和宏观的角度出发。其中宏观检测技术指的是当计算机截取了视频中的某一个图像,其以整幅图像为对象进行检测;微观检测技术是指在截取图像后,根据实际需求对某一区域内的图像内容进行检测。在计算机视觉技术实际应用时,其第一步就是对图像的采集,第二步是对已经采集的图像进行预分析处理,如果采用宏观检测技术则对图像整体进行分析;如果采用微观检测技术则首先将图像进行分割,然后对分割后各图像内容中出现的运动物体影像进行分析。在图像数据获取过程中应用的是背景差分法,这一技术主要是将背景和运动物体进行分离提取,以获取没有背景图像的运动物体影像数据。还可以利用帧间差分法,这种方法主要是对一个视频图像的逐帧画面进行差别比较,从而获得各帧图像上的差值,而将这些差值帧图结合起来就是一个物体在计算机视觉下的运动轨迹。现代研究者更倾向于将背景和帧间差分法进行结合运用,这样可以获得无背景下的运动物体轨迹,进而提升计算机视觉系统捕捉数据的准确性。

2 OpenCV的应用概述

OpenCV是现代计算机视觉技术当中具有开源性的视觉库,其最早是由俄罗斯Intel分公司所研发,不仅高效,而且具有兼容的优势。同时与传统IPL图像处理系统相比,OpenCV所处理的图像数据等级更高,例如在对运动物体进行特征跟踪、目标分割、运动轨迹分析以及三维模型重建等方面都有着巨大的优势。

OpenCV本身编辑的源代码是开放式的,编写过程简洁且方便,并且程序中大多数函数已经通过了汇编的最优化,使其能够更加高效地被应用。在使用OpenCV的摄像机标定模块已经为用户设计了实用性较强的接口,并且能够支持Windows界面的操作平台,使得这一技术的操作更加简便。这一技术本身操作简便,对于编程人员和检验人员个人技能素质要求并不高,视觉技术系统研发人员可以利用简便的操作来检验其设想是否能够实现,这就使得现代计算机视觉技术开发团队能够形成更好的协作研发关系,进一步提升技术研究效率。目前已知OpenCV编程系统在航空航天定位、卫星地图绘制、工厂大规模生产视觉检测等方面得到了广泛的应用,同时对于无人飞行器的视觉捕捉技术也有极大的帮助。最为重要的是OpenCV编程语言的兼容性较强,编程人员可以根据自己的意愿对源代码进行披露,并且国内也已经形成了规模较大的交流社区,给更多同行业者提供答疑解惑的场所,进一步扩大了OpenCV的应用范围。

3 基于OpenCV的计算机视觉技术

3.1 基于OpenCV下的运动物体检测技术

在常规运动物体检测技术下,均是直接通过图像背景和运动物体的区分来实现运动物体的捕捉。而基于OpenCV下的运动物体检测技术则不仅能够针对于图像背景的分离实现运动物体的观察,还可通过物体本身特定的信息来进行检测,主要包括形状、轮廓以及颜色等。这样就能够实现在复杂的背景当中将特定的运动物体完整抽离出来。其基本流程包括:首先,对影像数据当中某一时间点的图像进行捕捉,然后对这一视频图像的格式进行转化;其次,对转化格式后的视频图像进行早期处理,并将运动物体和复杂的背景区分开,降低周围各环境因素对运动物体主体图像的影响;第三,根据完成提取后的运动物体图像进行辨识,然后再从视频当中捕捉拥有相同特征的物体,并对该物体进行跟踪识别。而这一过程的实质则在于先利用图像捕捉技术对画面进行截取,然后同时利用背景差分法和帧间差分法对图像进行分割,逐帧地将运动物体完成提取出来,以供计算机进行视觉跟踪处理。

3.2 基于OpenCV的图像预处理技术

一般情况下,计算机视觉处理技术应用的环境情况较为复杂,大多数应用环境当中均有光照的变化,并且部分计算机视觉处理设备还需要在露天环境下进行工作,此时周围环境中的风、温度、光照、气候以及运动物体数量等对视频图像的采集均有着极大的影响。环境因素会使图像采集的质量大幅度降低,同时图像当中的噪点问题也难以避免,而噪点是视觉捕捉和图像处理当中最大的影响因素。因此,在基于OpenCV下的计算机视觉技术在捕捉视频图像之后先对其进行预处理,然后再由系统对运动物体进行分离、检测和跟踪。一般的预处理过程主要包括平滑度滤波、图像填充、背景实时更新等。

1)图像的平滑度滤波预处理技术

由于在实际计算机视觉捕捉过程中图像噪点是难以避免的问题,以此在对图像中运动物体进行检测前,应该相对这些噪点进行预处理,降低环境噪声对图像的影响。图像的平滑度滤波处理共分为两种方式,分别为线性和非线性。其中线性处理方式就是通过计算机处理设备的简单运算,对图像当中的噪点进行直接清除,但这一技术使用后会造成截获图像模糊不清的情况,因此仅对噪点较少的图像采用该处理方式;非线性滤波处理则是利用复杂的图像处理运算,将截获图像当中的噪点无限缩小,使其不对图像整体造成影响,并且可以有效保证图像的局部调整,但这种处理方式在运算时速度没有线性滤波处理快,因此需应用在噪点较多,图像信息较复杂的处理当中。

2)图像的填充预处理技术

这一处理技术在使用过程中运算速度较慢,主要是由于其需要对逐帧的图像均进行处理,也包括两种处理方式,分别为边缘填充和腐蚀膨胀处理。其中边缘填充处理主要指的是在确定运动物体之后,利用计算机系统自身的边缘检测处理技术,对物体的轮廓进行辨识,并利用形态学上的漫水填充方式对运动物体周围的噪点进行颜色填充,减小其对画面整体元素的影响。而腐蚀膨胀处理与边缘填充处理原理相类似,但这种处理技术主要是针对于噪点进行腐蚀和膨胀,使其在画面当中所占比例扩大,但对运动物体本身不造成影响,这使运动物体和噪点之间的差异就会更加明显,就可以将噪点的影响降到最低,但这种处理方法的效果和摄像机本身的性能、质量等有着密切的关联。

3)背景的实时更新预处理技术

在进行运动物体和背景分离过程中,计算机系统需要对图像上的背景元素进行辨识,并对其开展初始化处理,这样就能够为后期实时背景图像的差异进行凸显,以增加前景图像的效果,降低噪点对图像的影响。在运用这一技术时,首先要先对第一帧的图像进行确定,并将第一帧图像当中的背景图像元素进行辨识,然后在后期图像更新和运动物体检测过程中对背景进行实时更新处理。在更新的过程中其流程主要包括:首先,系统要对所读取的画面进行有效的判断,了解该图像是否为第一帧;其次,将Opencv处理的图像转变为单通道灰度值;第三,对转变后的图像进行高斯平滑度滤波处理,将图像当中的噪点进行去除;第四,采用形态学噪点填充技术对图像当中的噪点进行二次处理,以获得所需要更新的背景图像。

3.3 前景运动物体的提取技术

在计算机视觉技术进行运动物体的检测时,只有有效保障检测流程的准确度,才能够有效保障对前景运动物体的跟踪效果。其主要分为两大步骤,其一是对二值化后的图像数据进行分割处理;其二是在图像分析前对其进行充分的填充处理,保证前景图数据的完整性。同时,在前景图像提取的过程中也分为多个步骤,其包括:首先,对所提出的前景图像和背景图像进行差分处理;其次,将差分处理后的图像二值化处理;第三,对背景当中前景物体的轮廓或边缘进行辨识,根据前景图像的轮廓对其进行填充。由于在实际操作过程中,摄像头所处环境的变化较大,并且会在不同场所内的不同角度捕捉画面,因此就需要在前景图像提取时有效提高背景图像实时更新的效果。

利用阀值二值化的分割方式能够有效将前景图像和背景图像分离开,从而使目标运动物体能够呈现独立化,并且阀值分割方式开展前要相对每个像素点进行确定,判断其是否位于灰度值的范围内。而将该图像的像素灰度和阀值进行对比后会出现两种结果,分别是灰度值低于或高于阀值。在实际应用过程中,有效确定图像的分割阀值T,就能够降低环境当中光照因素对图像质量的影响。

4 计算机视觉技术当中的三维重建技术

1)三维重建的视觉系统

计算机视觉技术在对图像进行捕捉时可以视为是对大量的图像信息进行处理,从摄像机的视觉角度出发,其所输入的图像一般为二维属性,但输出的信息确是三维数据,而这种三维空间数据能够提升对运动物体所处空间位置、距离等描述的准确性。在三维重建视觉系统工作过程中,其相对基本的图像数据框架进行确定,然后利用一个坐标点建立2.5D图像数据,即以此点为视角能够观察到的图像数据,再将2.5D图像数据进行整合从而建立三维图像。

2)双目视觉系统

当人体利用双眼在不同角度、同一时间内观察同一个物体时,就可以利用算法来测量该物体和人体之间的距离,而这种方法也被称为双目立体感,其应用的原理主要是人体视觉差所带来的影响。同时利用两台摄像机对同一图像从不同角度进行观察,就能够获得人体双目观察后的效果,因此这一三维重建技术也被称为“双目视觉系统”。两台不同的摄像机即可代表人体双眼,其对图像进行逐帧捕获,但由于角度不同和环境影响因素的差异,因此造成了图像差异,必须对其捕捉的图像进行预处理。

3)三维重构算法

在计算机视觉技术中对于视频流的采集主要依靠的是彩色摄像机、红外摄像机、红外接收摄像头等设备。还可以利用微软所提供的Kinect设备,在进行运动物体检测前能够对NUI进行初始化处理,将系统内函数的参数设定为用户信息深度图、彩图、骨骼追踪图等数据。在使用Kinect设备对视频流进行打开时,其可以遵循三个步骤,其一是彩色和深度数据的处理;其二是根据数据的索引添加颜色信息,并将其引入到深度图数据当中;其三是骨骼追踪数据。

5 结束语

计算机视觉捕捉技术是现代计算机应用当中较为先进的内容,其应用范围较广,对于运动物体的捕捉准确度较高,能够有效推进现代计算机模拟技术的发展。

参考文献:

[1] 张海科.基于Opencv的人手识别与跟踪定位技术研究与实现[D].昆明: 云南大学,2013.

第2篇:计算机视觉技术范文

【关键词】视频跟踪 手部识别

1 引言

计算机从诞生至今,其输入设备从最初的机电开关,逐渐发展为打孔纸带、磁带,再到今天的键盘、鼠标和游戏手柄,向计算机输入数据的效率越来越高,但方法的本质并未改变,都要将自然信息通过机械式方式输入计算机。这些方式都是基于2D的图形界面,将用户的操作限制于特定的外部设备上,无法实现自然而随意的人机交互。长时间使用,会使用户感到疲惫,导致用户体验下降。

对于用户来说,人的语音、手势等可以说是最为自然、最为方便的交流手段,同时手势在3D环境中意义明确、方向精确,是极好的人机交互手段。许多大型互联网公司与游戏公司早就对此进行了探索。微软,索尼,任天堂等公司有着自己研发的外部设备,如游戏手套和传感器等,以此来捕捉并记录手部的运动轨迹,实现特定的操作乃至体感游戏。但这类外部设备的缺陷也是很明显的:这类设备一般为机械传感器式或光纤传感器式,带有传感器、机械部件甚至用来与主机连接的电缆等,沉重、累赘、不灵活;且通常价格昂贵、极易损坏,用户体验不佳;更重要的是限制于特定平台,不具备通用性,普及度不高。

若能实现基于计算机视觉技术的手势识别及操作系统,不仅可以将我们的双手从特定外部设备上解放出来,使操作更加轻松、随意,还能获得更好的人机交互体验,推动“虚拟现实”的研究。目前已经有了大量的跟踪算法和相关设别,如微软的Kinect摄像头及最新的Hololens头盔已经能达到很好的效果,但都较为复杂。因此本文研究一种简单通用的基于计算机视觉的手部跟踪算法。

2 手部区域提取

2.1 样本采集

为了保证研究的顺利进行,首先需要采集手部样本图片。为保证实验结果的准确性,样本图片数量最好在100张以上,并记录不同姿态,其中男性样本和女性样本的数量保持相等。

2.2 肤色信息分析

肤色信息近似为皮肤的颜色信息,物体表面的颜色即表面色是因光照而呈现的颜色[6]。我们采用RGB颜色模型对手部表面肤色进行分析,发现肤色处于某个范围之内。方法如下:手动提取样本图像中的手部,对其进行RGB颜色分量统计,得到各分量直方图。由于各分量直方图上手部体现为一个近似波峰,所以可取波峰的半峰全宽(Full Width at Half Maxium)作为手部的肤色阈值。

根据肤色阈值提取手部,设HandSkin表示肤色阈值范围,RGB(m, n)表示点(m, n)处的颜色信息,而bw(m, n)代表该点是否是手部,则:

2.3 模式识别

通过肤色信息初步提取手部后,可能会有孤立的局部点集出现。为此,统计所有互相连接的点集,提取点集对应的几何特征,建立规则来选取符合手部的点集。

几何特征一般包括面积、周长、重心等。而手部可以分为手掌和手指部分,手掌形状近似于椭圆,手指为细长的柱体,因此整个手部的周长面积比会与其他物体有所区分,所以根据周长面积比将手部从背景中提取出来:

面积:指物体区域包含的像素数,用符号s表示。

周长:物体轮廓线上像素间距离之和,用符号c表示。在进行周长计算时,需根据像素间的连接方式,分别计算距离。像素间距离可分为并列连接像素与倾斜连接像素。并列有上下左右四个方向,像素间距离为1;倾斜方向有左上、左下、右上、右下,其像素间距离等于单位正方体的对角线长度。本文中先获取二值图像的边缘信息,再使用8向链码求周长。

周长面积比:用r表示,r = c/s。

求得所有样本的面积周长比后,通过统计建立规则,并排除异常数据。设h表示点集,hand表示手部,handrule表示手部点集所必需满足的规则,noise表示噪声,s.t.表示满足,则最终的手部点集为:

3 手部跟踪

基于计算机视觉的手部跟踪算法具体步骤:

步骤1:第一帧图像预处理。根据上文所述方法进行第一帧的初始化。通过肤色信息和面积周长比特征提取出第一帧图像中的手。为了方便描述手的运动轨迹,用几何图形来近似表示手部区域,本文选用包围手部区域的最小椭圆来表示手部,该椭圆的中心O1表示手部中心点。

步骤2:依次扫描视频的每一帧。对于第n帧,由于相邻帧的时间相隔较短,手部不会有太大位移。根据上一帧手部区域的位置,设置该帧的扫描范围。通过第2章方法,得出当前帧手部的中心点On。不断重复算法直至视频结束。

步骤3:描绘运动轨迹。从视频最后一帧的中心点On开始,逆序依次连接On与On-1,直至视频第一帧的中心点O1,得到完整的手部运动轨迹。

4 结论

本文所提出的以手部肤色信息为基础的手部跟踪算法,工程实现上较为简答,算法效率高,经试验测试,能够较为准确地再现手部运动轨迹。同时,该种方法也具有缺点,在手部快速移动或做复杂运动时,算法所描绘的运动轨迹可能会出现断裂,且该算法对光照敏感,在过强或过弱光照条件下,算法的准确性都会受到影响。今后的工作将继续完善本算法,将尝试以HSI颜色模型进行分析,考虑引入手部纹理与边缘信息,减弱算法的光照敏感性,采用专家系统、智能优化、神经网络、特征降维等高级技术。

参考文献

[1]俞烈彬,孟凡文.武器装备系统中的人机交互新技术[J].电子世界,2013(12): 164-165.

[2]孟艳丽,郭建.二语演讲中手势功能的实证分析[J].河南科技大学学报(社会科学版),2014,32(3):62-67.

[3]刘晋钢,刘卫斌,刘晋霞.Kinect与Unity3D数据整合技术在体感游戏中的应用研究[J].电脑开发与应用,2014, 27(11):7-14.

[4]张蓬,王晓冲,陈建义.多自由度机械臂的虚拟现实仿真实现[J].机械设计与制造,2015(01):128-134.

[5]闫庆森,李临生,徐晓峰,等.视频跟踪算法研究综述[J].计算机科学,2013, 40(6A):204-209.

[6]奚吉,赵晓铃,张煜东.改进的沃尔什滤波的图像插值算法[J].计算机工程, 2010,36(22):211-213.

[7]张煜东,吴乐南,王水花.专家系统发展综述[J].计算机工程与应用,2010, 46(19):43-47.

[8]王水花,张煜东,吉根林.群智能算法的理论及应用综述[J].南京师范大学学报(工程技术版),2014,14(4):31-38.

[9]张煜东,吴乐南,韦耿.神经网络泛化增强技术研究[J].科学技术与工程,2009(17):4997-5002.

[10]张煜东,霍元铠,吴乐南,等.降维技术与方法综述[J].四川兵工学报,2010, 31(10):1-7.

作者简介

罗伟,男,江西省景德镇市人。现供职于南京师范大学计算机科学与技术学院。研究方向为手势跟踪。

通讯作者

张煜东,男,江苏省南京市人。博士学位。现为南京师范大学计算机科学与技术学院教授。研究方向为图像处理。

作者单位

第3篇:计算机视觉技术范文

关键词 计算机视觉;立体匹配;研究情况

中图分类号:TP391 文献标识码:A 文章编号:1671-7597(2014)07-0001-01

随着科学技术的快速发展,计算机技术也得到了飞速的发展。将计算机技术应用于人类的视觉系统,并辅助人们观察到一些眼睛难以看到的东西,已经逐渐成为一门大家所热捧和追逐的技术。随着人们对视觉传感器技术越来越多的探索,人们也逐渐实现了古代时想拥有千里眼的梦想。目前,人们已经把视觉传感器技术和计算机技术良好的结合在一起,并把这些技术应用到食品、建筑、医药、电子、航天航空等众多领域当中。而该项技术的快速发展,也帮助人们解决了一些日常工作当中人类视觉存在盲区的问题,保证了人们工作过程的安全。视觉技术与IT技术的完美结合使得人们的生活变得更加便利,让人们亲身体会到了IT技术给人们生活带来的便捷。

1 双目立体视觉概述

双目立体视觉又称双目视觉技术,是目前计算机视觉应用领域的重要研究内容。双目立体视觉控制系统的组成因其采用的原理和应用功能的不同,组成也都各不相同。

双目立体视觉的实现原理是基于人眼的视网膜看物体的特性,从两个不同的方向来观看同一个物体的不同角度,从而实现清楚的了解到物体的图像的目的。双目立体视觉从不同的角度获得物体的投影信息,并根据匹配的结果,获取同一个物体不同偏差位置的信息。最后在依据三角测量技术,根据已经获得的这些偏差信息从而获得这些不同点对应的距离信息,并最终获得这些实际物体的具体坐标位置信息。

视差测距技术告诉我们,要清楚的观察到一个物体的全貌,需要两个观察物从不同的方向,或者固定一个观察物,移动另外一个观察物的方式,以达到拍摄同一个物体的目的。根据同一个物体在两个观察物当中的位置偏差,从而确定该物体的三维信息。一般来说,双目立体视觉的组成包括:图像获取设备、图像预处理设备、摄像机标定设备、立体匹配设备、根据二维信息实现三维重构设备等五个重要设备。

2 双目立体视觉技术的原理

立体画又可以称之为三维立体画,是一种人们可以从三维立体图中获取二维平面图信息的技术。三维立体图表面看似毫无规则,但是假如通过一些特殊的技术或者通过合理的观察手段和观察设备,就可以看到一组秩序井然的美妙图片。

三维立体图是一组重复的二维图片有序的堆积积累而成,因此可以呈现出立体效果。人体观察物体的原理大致如下:当人类通过左右眼观察所在的空间平面的时候,这些平面图都只是一些毫无秩序的图片。而当左右眼重新聚焦或者在观察画面的时候呈现一定的层次感,则人类的左右眼观察到的一组重复案在经过人体识别以后,这些画面之间将存在一定的距离差异,从而在脑中生成立体感。

双目立体视觉技术正是基于以上的原理,从两个不同的方向去观察物体,并获得目标图像的信息,并经过一定的处理获得三维重建的物体立体信息的技术。

双目立体视觉在计算机技术中实现三维重建的大致流程

如下。

1)摄像机定位,并通过单片机计算得到要获取图像信息需要的外部的参数的大概值,并根据这些参数值设定摄像机。

2)用设定参数的摄像机拍摄目标场景的画面,并采集这些画面的二维图的信息。

3)通过计算机技术实现双目匹配,并判定采集画面中的二维图像中的不同点之间的对应关系。

4)在第三步中若得到两组二维图像的关系是稠密的时候,则生成三维视差图。如果不是则进一步采集图片信息。

5)根据得到的视差图最终实现场景的三维图形的重建。

3 双目立体匹配技术的研究难点和未来的发展方向

尽管目前有很多学者都投身到双目立体匹配技术的研究和开发当中,直至目前为止也解决了很多关于视觉理论当中存在的很多缺陷问题。但是视觉问题是一个复杂且难以解决的问题,特别是在双目立体匹配问题方面更是困难重重。立体匹配技术的难点已经成为限制将双目技术应用到计算机技术当中的重要瓶颈。

立体匹配的主要手段就是找到计算机采集到两幅和多副图片的中像素的对应关系,然后根据这些像素关系判定并生成三维重建图。但是二维图像的匹配存在层层困难,主要体现在以下几个方面。

1)由于视角的问题或者观察物体存在遮挡问题,导致采集回来的图片信息存在盲点,这样子更难找到图片的匹配区域。

2)场景中的一些深度不连续的区域大都处在场景当中的边界位置,这些位置容易出现像素不高,边界不清晰等问题,这些问题也给图像匹配带了很多困扰。

3)场景当中的低纹理的图片匹配特征和匹配关系较少,而且该位置的每个像素点极为相似。假如只是通过简单的像素相似性检测的话,会检测到很多匹配结果,而这些匹配结果当中有一大部分是错误的。这样子的结果势必会导致最终的图像匹配正确率极为低下。

从以上的分析,我们可以看出立体匹配技术存在很多技术上的难点,这些都在很大程度上限制双目立体匹配技术在计算机当中的应用发展。如何才能设计出有效、准确、快速、通用性强的立体匹配算法将会是以后双目立体匹配计算发展的重要方向。也只有通过设计出一套行之有效的立体匹配算法才能使得双目立体匹配技术在计算机视觉当中得到广泛的应用。

4 结束语

人们通过眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立体信息,分辨出观察物的广度和深度,以及物体的远近。因此人类视觉感知系统就是一个双目的立体感知系统。本文讲述的计算机中的双目立体匹配技术正是基于人眼视觉观察物体的原理,通过双目立体视觉原理,对计算机采集获得两幅二维图像的信息进行分析,并结合计算机的分析,最终获得同人类眼睛一样观察到物体三维表面信息的目的。双目立体匹配技术与计算机技术的完美结合帮助人们可以更加轻易的获得物体的信息。希望在不久的将来,可以将该项技术应用于人类的视网膜当中,以帮助一些视网膜存在问题的人们,让他们重新感受到光明,感受世间的温暖。

参考文献

[1]高文,陈熙霖.计算机视觉算法与系统原理[M].北京:清华大学出版社,2002.

[2]明祖衡.双目立体视觉测距算法研究[M].北京:北京理工大学,2008.

[3]刘昌,郭立,李敬文,刘俊,杨福荣,罗锋.一种优于SAD的匹配准则及其快速算法[J].电路与系统学报,2007,12(4):137-14.

[4]陈蛟.双目立体匹配的算法研究及其多核并行化[M].南京:南京邮电大学,2012.

第4篇:计算机视觉技术范文

【关键词】 计算机视觉 四轮定位 相机标定 仿射变换 透视投影 畸变系数

Wheel Alignment Based On Computer Vision Without Pushing Car Technique Research

WangQiu1,ZhouYue1 Department of Automation, School of Shanghai Jiao Tong University,

He Jian-guo Company of Daheng Image)

Abstract:Wheel alignment technology based on computer vision which can get the parameters of the wheel quickly and efficiently, has good prospects. This paper researches alignment technology based on computer vision without pushing car. This paper gives a detailed mathematical model of the method, and we have done a field experiment test. The results show that the proposed model is correct and efficient. The method proposed is an innovation in the field of alignment technology.

Key words:computer vision,perspective projection,camera calibration,distortion coefficient,affine transformation, wheel alignment

一、引言

随着国民经济的发展,越来越多的汽车进入千家万户,随之对汽车的维护需求也日益膨胀,而作为车辆维护的必要设备―四轮定位系统,本文提出的方法标定方法简单,并且采用无推车的技术让操作更加方便。

二、模型分析

本文采用单标定板标定两个相机的方式,该方式可以降低传统的标定方法带来的标定误差,高精度的还原两摄像机的位姿关系,在定位阶段,不需要操作者去推车获取车轮的各项参数,本文提出的方法可以直接提取车轮姿态计算出定位参数。

2.1 圆心提取

空间圆成像后通常呈现为椭圆的图像,而椭圆的中心并不是空间圆心所对应的像素点,图1显示了空间圆经过透视投影变换后其中心点的变化。

针对这个问题,Heikkil■已经对其进行了研究,并建立空间圆心在相机成像平面上的畸变误差模型[1]。

2.2 相机标定

本文是采用标定板标定板上有很多圆点,如图2,图样左上角有一个三角定位点,用于确定标定板的x,y,z轴方向。

平面靶标上的圆点中心记为W=[x,y,z]T,其图像坐标为m=[u,v]T,对应的齐次分别坐标为W'=[x,y,z,1]T, m'=[u,v,1]T。由摄像机的成像模型,空间点W'与m'之间的关系如下:

sm'=A[R t]W' (1)

式(1)中,s为尺度因子,R为标定板相对于相机轴的旋转矩阵,t为标定板相对于相机的平移向量,A为摄像机内部参数矩阵,A定义如下:

A=a■ r u■0 a■v■0 0 1

其中,(u0,v0)为图像平面主点坐标,ax,ay为图像坐标轴的尺度因子,r是图像坐标轴的不垂直度。在二维平面靶标中,通常我们认为靶标上的点的z为0,即设定标定板平面为世界坐标轴的xoy平面。在图二中我们设定世界坐标系的x轴向右,y轴向下,z轴垂直纸面向里。我们把矩阵R的每一列用ri(i=1,2,3)表示,则式(1)表述如下:

suv1=A[r1 r2 r3 t]xy01=A[r1 r2 t]xy1 (2)

令H=kA[r1 r2 t]为一个3行3列的方阵,r1,r2 为图像坐标轴的方向矢量,k为常数,记H=[h1 h2 h3],则

[h1 h2 h3]= kA[r1 r2 t] (3)

由于t不会位于r1,r2构成的平面上,且r1,r2正交,则det[H]≠0。H的计算是使图像坐标pi与(1)式计算的mi'方差最小的过程,定义目标函数:

F(H)=min∑■■pi-mi'(n为点数)

令■=0,即可求出H。求出H后,由R的正交性(r1Tr2=0, r1Tr1=r2Tr2)可得方程:

h1TA-TA-1h2=0h1TA-TA-1h1=h2TA-TA-1h2 (4)

B=A-TA-1=B■ B■ B■B■ B■ B■B■ B■ B■

经计算上述矩阵后,得知B为对称矩阵。则令:

b=[B11,B12,B22,B13,B23,B33]T

设H中第i列向量为hi=[h1i,h2i,h3i]T,因此有

hiTBhj=Vijb

其中

Vij=[h1ih1j,h1ih2j+ h2ih1j,h2ih2j,h3ih1j+ h1ih3j,h3ih2j+ h2ih3j,h3ih3j]

即可将等式(4)改写为以下齐次方程

v12T(v11-v12)Tb=0 (5)

如果将平面靶标移动n个不同的位置,拍摄n幅图像,可以得到n个(5),将这n个方程组合起来,可得:

Vb=0

其中V为一2n行6列的矩阵,对V进行奇异值分解求出b,求出b后,利用Cholesky矩阵分解算法求出A-1,即可求出摄像机内参矩阵A,得到A后可根据(3)式求出摄像机外参:

r1=■ r2=■ r3=r1×r2 t=■

该系统中我们采用了两个相机,通过以上求解可以得到左右相机外参分别为Rl,tl以及Rr,tr,对于两相机公共视场中的任意一三维点xw,在左右相机中成像点坐标为xl,xr则:

xl=Rlxw+Tl,xr=Rrxw+Tr

两式消掉xw,得到xr=RlRr-1xl+Tr- RlRr-1Tl,因此可得两摄像机的相对位置关系如下:

R= RlRr-1,T= Tr-RlRr-1Tl

令Hr2l=R T0 1,该矩阵在2.4节中需要用到。

2.3 参数获取

根据已知参数,我们可以的到空间圆方程,将空间圆的方程表述如下:

MTCM=0

其中M=[x,y,1]为空间平面圆上的点(z=0)。C为圆的系数矩阵,矩阵各项参数已知。

经过相机成像以后,在图像平面上一般呈椭圆形状,其方程表述为:

mTQm=0 (6)

其中m=[x,y,1]为成像平面椭圆上任意一点。Q为椭圆的系数矩阵,矩阵各项参数已知。

M与m存在一边换矩阵H,即:

sm=HM (7)

其中s为缩放因子,H为待求矩阵。

将(7)带入(6),可得:

C=HTQH (8)

从上式即可求出H矩阵。确定H矩阵之后,已知A,即可求得r1,r2,r3,t。我们就可以得到车轮中心点在摄像机坐标系下的坐标C(x,y,z)以及车轮法向量在相机坐标系下的表示V(Vx,Vy,Vz)。

2.4 仿射变换

变换后的的中心点记为Cr2l,变换后的法向量记为Vr2l,变换等式表述如下:

Vr2l=HV

Cr2l=HC

2.5 获取结果

经过上述仿射变换之后,我们可以得到四个轮胎在左相机下的各项参数,根据四个车轮中心点,我们可以用LM算法拟合车身平面,求出车身法向量P(Px,Py,Pz)再结合四个车轮法向向量V,我们即可得到车轮的各项参数。

三、实验

3.1 相机标定

实验用大恒MER-130-30UM工业相机,采用日本Computar 1614-MP2工业镜头,照明为普通的直流灯管。经过双相机的标定,标定出左相机参数Al,右相机参数Ar,左右相机的相对变换矩阵Hr2l,将Hr2l转化为位姿P的形式,其中前三个分量为右相机相对左相机的平移分量(单位为米),后三个分量为右相机相对做相机的旋转分量(单位为角度)。Al,Ar,Hr2l,P值如下:

P=[2.33575,-0.00635,0.0793,3.08728,-58.1271,

1.15163]

3.2 实验结果

后轮效果图如图3所示,相机拍摄的前轮效果图如图4所示,处理后的效果分别如图5,图6所示。

上图车轮红色区域即为提取的成像的椭圆轮廓,上面的三色轴即为根据测量的圆的三维姿态,从右图可以明显看出由于透视畸变带来的中心点偏差。

从表1中可以看出,本文方法测量结果与真实值以及杰奔四轮定位仪测量结果基本一致,证明了该方法的正确性和有效性。

3.3 误差分析

从实验数据可以看出,数据的稳定性相对于杰奔的稍差,分析其原因,主要是相机在提取车轮外圈椭圆的算法的稳定性导致的,所以在使用该论文提出的方法的时候必须要保证算法能稳定提取图像中的椭圆边缘。

第5篇:计算机视觉技术范文

关键词:烟叶数字图像;边缘处理;形态学变换;特征抽取;智能识别

1引言

烟叶是烟草工业的基础原料, 对烟草工业生产质量和烟草行业经营效益具有举足轻重的作用。对烟叶生产过程的各个环节包括烟叶品质的智能识别进行技术创新,提高品质和效率,是一个前沿研究方向[1][5]。

当前这一方面的研究,主要集中在数字图像处理方面,把烟叶品质的数字图像处理与神经网络技术相结合,实现烟叶品质的智能识别,是一个极有价值的工作。以下在此方面作出一个系统的、较为完备的、易于实际操作的研究。

2主要技术手段

2.1 MAⅡAB图像处理工具箱

在MATLAB平台上,借助图像处理工具箱,可以简易明快地实现对烟叶数字图像的图像处理。在烟叶生产一线,用数码照相机对各种烟叶样本进行拍照,输入计算机,用MAT_LAB将它转换为各(.bmp;.jpeg;.gif;.png;.t 图片以便进行图像处理。成本低,精确度高,宜于普及推广。获取各种类型的烟叶数字图像以后,经阈值使用权图像二值化,可以当即辨识出这一图像是否具有何种类型的病虫害或品质异变。利用烟叶数字图像的边缘检测、轮廓提取等分析命令,获得待测烟叶的图像参数和特征,再由神经网络技术,完成对烟叶品质的智能识别。

2.2神经网络技术

神经网络是一个新的智能识别工具。毕业论文 经过训练的神经网络能够存储与过程有关的信息,能直接从历史数据中学习,经过用各种烟叶样本训练和学习的神经网络,能自动地识别出待测烟叶样本的品质类型。而且,神经网络具有滤除噪声及在有噪声情况下得出正确结论的能力。这一点对于烟叶生产实际中大量存在各种噪声信息的情况而言,特别重要。它特别适合在线识别。

3应用MATLAB图像处理工具箱和神经网络技术对烟叶品质智能识别的操作过程

3.1烟叶图片样本库的建立

用数码相机或其它数字图像采集工具,采集各种类型的烟叶的标准图片,分类归档,借助MATLAB图像变换功能,将各种类型的烟叶的标准图片,转换成各种图片形式:.bmp;.jpeg;.sir;.png;.tif等,以便随时调用。这些烟叶图片,有不同品质的样本;还有各种病虫害标本和变异标本。

3.2用直方图均衡来实现图像增强

当从生产一线采集的烟叶待测样本的图像对比度较低,硕士论文 即灰度直方图分布区间较窄时,可用直方图均衡实现灰度分布区间展宽而达到图像增强的效果。

3.3烟叶图像的边缘检测和特征提取

烟叶图像的基本特征之一是图像边缘。图像边缘是图像周围像素灰度有阶跃性变化或屋顶变化的像素的集合。烟叶的边缘是由灰度的不连续性所致,因此考察图像每个像素在某个邻域内灰度的变化,利用边缘邻近一阶或二阶方向导数变化规律可以检测烟叶图像边缘。图像特征反映烟叶的几何结构,如面积、周长、分形分维数、孔洞数、欧拉数等等。图像特征的选择是图像识别的重要环节。运用二叉分类法在找出判别特征后,对不同的图像特征由分类阈值按二分的方法进行分类;运用相似距离分类方法把待判图像与一个标准图像相比,标准图像用样本图像特征向量的均值来表示。通过计算待判图像与标准图像之问的在相空间中的距离来判别图像和进行分类。这一过程还为用神经网络技术实现对烟叶品质进行智能识别作出必要的准备。

3.4数字图像矩阵数据的显示及其傅立叶

变换这一变换的目的是为提取特征、进行神经网络模式识别等作出必要的准备。

转贴于 3.5直方图均匀化

这是使烟叶图像性质更为优良而采取的一个技术操作,源代码如下:

I=imread ("yangshuo.tif');imshow (I);

figure,imhist(I);

[J,T]=histeq (I,64);

%图像灰度扩展到0-255,但是只有64个灰度级

figure,imshow (J);

figure,imhist(J);

figure,Dlot((0:255)/255,T);%转移函数的变换曲线

J=histeq (I,32);

figure,imshow 0);

%图像灰度扩展到0~255,但是只有32个灰度级

figure,imhist(J);

3.6采用二维中值滤波函数对受椒盐噪声干扰的图像滤波

MATLA图像处理工具箱具有强大的功能,能够对噪声干扰的烟叶图片进行消噪处理,模拟源代码如下:

I=imread ("eight.tif');

imshow (I);

J2=imnoise (I,"salt&pepper ,0.04);

%叠加密度为0.04 的椒盐噪声

figure,imshow 02);

I_Filterl=medfdt2 (J2,[3 ,3]);

%窗口大小为3x3

figure.imshow (I Fiher1);

I_Filter 2=medfdt2 (J2,[5, 5]);

%窗口大小为5x5

figure,imshow (I_Filter2);

I_Filter3=medf'dt2 (J2,[7, 7]);

%窗口大小为7x7

figure,imshow (I_Filter3);

3.7用神经网络技术对烟叶图像进行智能识别

神经网络作为一种自适应的模式识别技术,并不需要预选给定有关模式的经验知识和判别函数,它能通过自身的学习机制自动形成所要求的决策区域。网络的我由其拓朴结构、神经元特性、学习和训练规则所决定,它可以充分利用状态信息,对不同状态一一进行训练而获得某种映射关系,并且,网络可以连续学习,即使环境变异,这咱映射关系可以自适应调整。在上面各节获取烟叶图像特征基础之上,可以用神经网络技术进行图像模式识别。例如,基于概率神经网络PNN的烟叶品质智能识别,它的主要优点是:快速训练,训练时问仅略大于读取数据时间;无论分类多么复杂,只要有足够的训练数据(而这是烟叶生产一线可以做到的),就可以保证获得贝斯叶准则下的最优解,允许增加或减少训练数据而无需重新进行长时间训练。这一神经网络对于烟叶品质的图像识别,具有重要意义。 4结论

基于计算机视觉和神经网络技术的烟叶品质识别的数字图像处理方法,医学论文 是烟叶生产环节的一种技术创新,它可以在烟叶生产一线普及推广,简便易行,能够较大地提高烟叶品质检测的效率和质量,以及自动化程度和智能化水平。

参考文献

[1]于润伟.基于图像处理的稻米垩白自动检测研究[J].中国粮油学报,2007,1:122—124.

第6篇:计算机视觉技术范文

 

1 计算机视觉定义

 

人类天生具有五感,视觉便是其中之一,而计算机视觉,就是让计算机网络能够睁开眼看世界。让计算机有一定的视觉能力,可以从各个方面帮助人们进行监督、检验检测。利用计算机视觉科学可以使工作变得更加简便。计算机视觉主要应用于对二维码、条形码、照片、视频资料如片段等进行智能处理。

 

2 计算机视觉研究在医疗、交通中的作用

 

随着医学成像技术的发展与进步,图像处理在医学研究与临床医学中的应用越来越广泛。最常见的有癌细胞显微图像分割与识别、基于多特征融合的血红细胞识别和乳腺癌细胞计算机的自动识别等。计算机视觉技术的迅猛发展,为医疗诊断带来了很大的方便,同时促进了临床医学的发展。另外,在各大综合医院慢慢发展起的体检体系中,计算机视觉技术起到了决定性因素。随着体检的人数上升,对医院体检的管理、速度、准确性都提出了更高的要求。视觉识别轻而易举的解决了这个问题,只需要去识别体检人员的身份证,就可以将体检人员对号入座,检查过的项目,没有检查的项目一目了然。理化指标的检验,只需要在采血试管或采尿瓶上粘贴与体检者对应的条形码即可,利用视觉技术对号入座,方便而准确的确定每一位体检人员的血样及尿样。及提高了医院的工作效率,又将错误率降到最低。

 

计算机视觉在交通上同样得到了广泛的应用及发展。交通安全是交通运输中的重大问题,随着近年来机动汽车数量的迅猛增长,交通事故的发生也随之越来越频繁,给人类社会带来的危害也日趋严重,使很多的家庭失去亲人,甚至家破人亡。全国一线城市例如:北京、上海、广州、深圳等交通道路供需的矛盾日趋严重,交通安全、交通堵塞及环境污染已成为困扰我国交通领域的三大难题。基于图像处理的计算机视觉技术是通过摄像机获取场景图像,并借助于计算机软件构建一个自动化或半自动化的图像、视频理解和分析系统,并提供及时准确的图像、视频处理结果,以模仿人的视觉功能。主要功能如下:

 

一是基于计算机视觉技术的车辆牌照自动识别: 车辆牌照是车辆的唯一身份,对车辆牌照的有效检测与识别在车辆违章检测、停车场管理、不停车收费、被盗车辆稽查等方面有着重要的应用价值。尽管针对车牌识别技术的研究相对成熟,然而在实际的应用场景中,受到天气、光照、拍摄视角、车牌扭曲等因素的影响,车牌识别技术仍然有一定的改善空间。

 

二是基于计算机视觉技术的车辆检测与流量统计:目前城市交通路口的红路灯间隔时间是固定的,而不同路段、不同时间段交通流量是随机变化的。若能根据各个交通路口的交通状况辅以计算机进行自动分析,并判断与预测交通流量,无疑为交通警察出警,红绿灯时间间隔的动态设置等提供技术支持。

 

三是基于计算机视觉技术的公交专用道路非法占道抓拍:公共交通是每个城市交通的重中之重,城市的公共交通为老百姓提供了便捷的出行方式。公共交通的发展,有利于城市的节能减排,有利于降低城市的空气污染指数。由于城市公共交通具有运量大、相对投资少、人均占有道路少等优点,解决城市交通问题必须优先发展城市公共交通。然而目前拥挤、缓慢的公交出行方式已成诟病,因此发展“快速公交”将是未来公交的一种运行模式。道路畅通则是发展“快速公交”的前提,相应地,公交专用车道的设定必不可少。为防止其他社会车辆的驶入,并对违规驶入的其他社会违规车辆进行抓拍与惩罚是保证公交车道公交车专驶的一种重要手段。因此在公交车前部装置摄像头并辅以其他处理设备,从而可以使得每一辆公交车成为了一个流动的监控设备。

 

3 计算机视觉在条形码检测中的应用

 

条形码是将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符。在中国,由中国物品编码中心赋予制造厂商代码。那么最常见的计算机视觉应用与条形码检测就是在超市中。超市中每样产品都有自己的条形码,当人们选择了自己需要的物品后,来到收银台进行结账,我们会看见收银人员会用扫码器对物品的条形码进行扫描,扫描后就会出现产品的信息及价钱。记录以及扫描条形码的技术就是计算机视觉技术。

 

4 计算机视觉重要技术——智能识别

 

近年来,基于生物特征的鉴别技术得到了广泛重视,主要集中在对人脸、虹膜、指纹、声音等特征上,这其中大多都与视觉信息有关。指纹、人脸功能已经大范围在生活中应用,其中很多单位的打卡制度就是依据面部识别、指纹识别来实现的。社会飞速发展的今天,很多的单位都实行了上下班打卡制度,这一制度已经被作为单位管理制度中的重要一条。购买的打卡机就是采用计算机视觉的重要技术——智能识别来实现的。利用打卡机的储存功能,记录每个职工的指纹或面部容貌,规定在某一个时间范围内对应识别指纹或面部容貌,视为打卡。在上下班打卡的过程中,员工将面部或指纹对应在打卡机的制定位置上,让打卡机进行识别,当识别的结果与存储结果相同时,打卡成功。这样看起来十分简单的打卡机可以使单位的工作有序化,制度化,而实现这个功能的技术就是计算机视觉技术中的重要技术之一:智能识别。

 

5 计算机视觉技术的发展过程及未来

 

计算机视觉技术研究经历了近40年的过程,20世纪50年代的统计模式识别、60年代的Roberts的三围积木世界、70年代的Marr为代表的计算理论、80年代的主动视觉,但是仍然面临许多的问题。主要由于计算机视觉是一个逆问题,视觉信息多种多样,视觉知识的表达很困难,图像数据量巨大,信息存储于检索困难,对生物学、神经生物学等的研究有待深入。

 

计算机视觉技术的未来必定会朝着高科技发展,航空遥感测控地形地貌、电影特效制作、工业生产自动化检测、医学影像检测,再到天文领域等,在这些科学领域中计算机视觉将无法取代,成为主流的技术之一。

 

作者简介

第7篇:计算机视觉技术范文

[关键词] 计算机;数字技术;电影;发展

计算机技术的发展,使我们生产、生活的各个方面都发生着巨大的改变,在电影的领域也是如此。电影与科技发展密切相关,我们甚至可以说,电影发展史便是电影技术的发展史。每一次电影世界里的大变革,往往是以科学技术为先导的,其里程碑式的作品必定是新科技成果的展现并取得较大成功的范例。没有任何一门艺术形式像电影这样与电脑技术有着如此息息相关的联系。计算机数字技术的发展,为电影创作提供了丰富的手段,为电影创作者提供了广阔的创作空间,其想象力得以充分的发挥,从而为我们带来视觉盛宴。

毋庸置疑,电影已经进入了数字时代,数字技术是指借助一定的设备将各种信息转换为计算机能识别的符号系统,之后再借助电脑对信息进行运算、传送、还原的技术。大量使用数字技术的科幻大片《阿凡达》的导演詹姆斯•卡梅隆说:“视觉娱乐影像制作的艺术和技术正在发生着一场革命。这场革命给我们制作电影和其他视觉媒体节目的方式带来了如此深刻的变化,以至于我们只能用出现了一场数字化文艺复兴运动来描述它。”[1]

在数字技术中,有一项是电影界最常用的,也是能给我们与传统电影画面完全不同的绚丽画面、宏大场景的,就是3D技术。“3D是three-dimensional的缩写,就是三维图形。在计算机里显示3D图形,就是说在平面里显示三维图形。不像现实世界里,真实的三维空间,有真实的距离空间。计算机里只是看起来很像真实世界,因此在计算机显示的3D图形,就是让人眼看上去就像真的一样。”众所周知,计算机屏幕显示的是平面的,也就是二维的,我们之所以能够看到三维图像,是因为3D成像原理是依据人两眼的视觉差,人眼看到的东西总是近大远小,从而形成立体感,另外,人的两眼球之间会有一段大概8厘米左右的距离。所以,想要使人看到3D影像,必须让左眼和右眼看到不同的影像,在计算机屏幕上因色彩灰度的不同而使人眼产生视觉上的错觉,画面实际上也有一段差距,所有这些只是模仿人类真实双眼看到的情况。从另一个方面看,可以说电脑3D技术是虚拟三维技术,它只是看起来像三维罢了,利用计算机的运算达到视觉立体效果,使二维平面变为立体的,是非实体、虚拟的。而这种虚拟会给观众带来真实感,自然需要计算机无数次的精密运算、专业人员无数次的修改等。

总之,计算机技术与电影艺术的广泛结合,给我们带来了巨大的冲击力,现在普遍使用的3D技术所带来的视觉享受,在以往的电影中是无法找到的,计算机技术加入电影世界,形成了令人震撼的表现力,也带来了前所未有的吸引力。随着3D技术广泛应用于电影,现在的电影与传统领域的电影已经大大不同,观众已经适应了这种视觉张力,哪部电影没有这样的图画,会让人感到什么地方不一样。随着计算机技术的发展,电影随之会有更大的发展空间。

数字技术对传统电影的改变,主要表现在制作方式、表现手段、生成方式、电影题材、存储介质、接受渠道、观众心理等方面,另外,电影之外的附属品,如电影审美价值判断以及电影本体论等也都产生了巨大影响。数字技术在电影中的运用无疑是电影产业产生以来的重要变化之一。可以说,数字技术是对电影产生重大影响的技术革命,以下我们从计算机数字技术带来丰富的电影样式、使得虚拟世界的表现逼近真实、使传统电影的叙事性弱化、转而以画面、音效等吸引观众等三个方面来论述说明。

第一,计算机数字技术带来丰富的电影样式,使电影极大地延伸了题材范围,使新的表现对象进入电影文本。科幻电影、动画片、灾难片、动作片、探险片等,有了计算机数字技术的加入,都得到了巨大的发展。数字技术使科幻世界成为视觉真实,并使科幻片确立了牢固地位。数字技术让动画片获得了新生,传达了与传统动画片不同的内涵,动画片不仅仅是儿童的专利,已经跻身于主流电影行列。数字技术让虚拟世界真实再现,为观众提供了巨大的想象空间。

计算机数字技术催生了动画片,并使之发展与成熟。动画片在数字技术的支持下获得了新的生存空间,众所周知的20世纪40年代,迪斯尼曾经创造了一个动画黄金时代,我们耳熟能详的、经典的如《米老鼠和唐老鸭》《猫和老鼠》《白雪公主》《木偶奇遇记》等。但这些传统的经典在没有数字技术介入之前,都是从教育的角度去创作的。数字技术介入之后,动画片不再只是儿童的专利了。1995年迪斯尼与皮克斯动画联合推出的《玩具总动员》是第一部全部采用三维动画技术制作的动画片,片中所有的图像全部在电脑中生成。令人震惊的是《玩具总动员》上映后,仅3天时间就获取了5 700万美元的票房收入,充分证明了,这部动画片不仅仅是面对儿童市场,它也成为迪斯尼公司赚钱最快的动画片。

计算机数字技术,还使得动画世界中出现了真人的形象,动画与真人的结合表演,开拓出了一个崭新的艺术空间,给观众更丰富的视觉体验,电影形式得到了丰富和发展。计算机数字技术不仅把动画人物与真人表演完美融合在了一起,更重要的是它让传统的二维动画具有三维立体感。例如,《侏罗纪公园》运用3D技术创造出了各种活灵活现的恐龙,而这些恐龙与真人的表演,就像它们真的存在于那里。为了使虚拟的环境中创造出逼真的视觉效果,这部电影运用了110台高性能电脑和数百名电脑工程师,建立了2 000多个关节可以灵活转动的立体模型。其人物表情的丰富与皮肤的质感、技术创造的逼真效果、高超的造型、有层次的色彩等,使得这部影片赢得了3亿6千万美元的票房收入。

总之,这些由计算机数字技术带来的新表现领域,采用多种形式的计算机技术,或是三维的动画技术,或是二维、三维相结合的手法,使得动画片达到了逼真的艺术效果,并获得了广大成人观众的认可。人的无限想象能力,在这些影片中得到了实现并能够得到完美的展现。在计算机营造动画人物技术上的创新,完善电影的技术手段,发展影片的画面美观等方面的种种努力,使得这些以追求逼真画面、表现人类想象及技术展示为目标的动画片渐趋成为大人们的专利。我们不得不说,计算机数字技术让传统动画片焕发出新的生命力,并使之获得了较高的地位,在主流电影类型中占有一席之地。

第二,计算机数字技术的应用,使得虚拟世界的表现逼近真实。虚拟现实是1989年由美国的兰尼尔最早提出的,他认为,“虚拟现实是用计算机技术生成一个逼真的三维视觉、听觉、触觉或嗅觉等感觉世界,让用户可以从自己的视点出发,利用自然的技能和某些设备对这一虚拟世界客体进行浏览和交互考察。”[2]电影《阿凡达》的上映,为人们提供了直接接触虚拟世界的机会,越来越多的人开始了解并熟悉虚拟现实技术。它不仅给观众带来了一场震撼的视觉盛宴,也给电影世界带来了一场虚拟风暴。“虚拟现实技术是由交互式计算机仿真组成的一种媒体,能够感知参与者的位置和动作,替代或者增强一种或者多种感觉反馈,从而产生一种精神沉浸于或者出现在仿真环境中的感觉。”

我们可以说,虚拟现实技术是一门复杂的综合技术,它涵盖了众多学科的众多技术,如计算机图形学、仿真学、多媒体技术、网络技术、人工智能技术、传感技术等。虚拟现实技术中最主要的是表演捕捉技术,简单来说,表演捕捉技术就是通过捕捉演员的表演,再将真人演出影像与电脑动画结合,使虚拟人物符合人类的表情,创造出真实的虚拟人物表演,使动画的虚拟人物造型、表情等接近真人。捕捉的对象包括演员的肢体动作、面部表情,它们可以自由套进不同的虚拟角色中,创造更广阔的表演空间。例如,面部表情的捕捉,在演员表演时,头上戴上精密摄像仪器,将演员面部表情传给计算机,精密到连眼神上的细微变化都不会错过。这些数据经过计算机的一系列运算,再传输给虚拟角色,使之具有真人的各种表情、动作。

总之,虚拟现实技术使电影制作方式打破了传统的电影制作的模式。在这种模式下,影片的前期准备、中期拍摄和后期制作可以同时进行。我们在电影世界中,能够获得空前的听觉上、视觉上、情感上、想象上的审美体验,电脑的参与、科技的发展,使得人们在惊叹的同时享受美。

第三,计算机数字技术使得传统电影的叙事性弱化,转而以画面、音效等吸引观众。传统的电影都是以新奇的故事和曲折的情节来吸引观众,其中的佼佼者必定是在情节上能够得到广泛的认可,情感上得到广泛的一致。计算机数字技术的发展,为电影带来的全新的视野,故事的叙事性逐渐弱化,取而代之的是宏大的场景、虚拟的空间、非凡的人物等等画面和音效的全方位的冲击,给人以视听新感受。这种巨大的转变,一方面为观众带来了全新的体验,一种新的美学享受;另一方面,传统题材与形式的电影似乎丧失了生命力,变得毫无魅力。数字技术介入电影制作,不仅使传统的故事情节主线从影片创作的中心开始向边缘退位,它也让我们给电影重新定位,电影已经不是靠几个演员、几台摄影机就能制作出来的了,而是需要借助精良的设备、高超的技术,来完成多方面的综合,达到现实与虚拟的结合。数字技术的参与,使电影可以更大程度地展示美学特性。现在是视觉媒体的时代,电影应该顺势而为,新的计算机数字技术允许电影向真实性的极限挑战,创造新的银幕奇观,最终给人们带来前所未有的视觉体验。

现今的电影市场上,很难看到没有数字技术参与的电影。因为,计算机技术已经并迅速地改变着电影的一切。电影的制作、载体的形式、传输的手段,无一不融入电脑技术。电影的发行和放映也不再以原始物理的方式进行。令人目不暇接的3D画面,带给观众的感受是革命性的。数字技术对于电影已不仅仅是技术的革新,是全方位的改变,这是电影发展过程中不可回避的事实。传统的电影已经大大让位于新型的电影,人们的观念也发生了根本的转变,计算机数字技术已经不再是吸引人们眼球的卖点,而是电影中必不可少的一部分。

综上所述,电影与科学技术的结合,开创了电影制作的新纪元。计算机数字技术与3D技术参与电影制作与其他各个步骤,借助于计算机、多媒体、互联网等数字技术的发展,电影将完成电影发展历程上根本转变。相信在未来计算机技术的不断发展的催化下,电影也将会得到空前的发展。

[参考文献]

[1] [美]托马斯•A•奥汉年,迈克尔•E•菲利浦斯.数字化电影制片[M].施正宁,译.北京:中国电影出版社,1998:19.

第8篇:计算机视觉技术范文

关键词:计算机辅助环境艺术设计起源现状及发展

随着计算机软硬件的进步,计算机辅助设计逐渐成为建筑效果图表现的主流。所谓计算机辅助环境艺术设计是指设计师通过计算机技术表现设计意图,最终以图像的方式告知客户,使客户清晰地理解设计师的设计意图和创意,它是一种更为直接、有效的表现方式,通常又被人们称为计算机建筑效果图。

一、计算机辅助环境艺术设计的起源

计算机的发展及应用,使人们的生活日新月异。计算机辅助设计源于计算机图形技术的产生,计算机辅助设计的研究构想发端于1950年,但使用计算机绘图的最早记录是在1963年,美国麻省理工学院的研究人员伊凡·苏泽兰在美国计算机联合会会议上发表了名为《画板》的博士论文,从而开始了计算机辅助设计的发展历程。他从1950年开始着手开发通过图形技术来处理人与电脑交互对话的操作系统。1963年,这套以电脑主机、显示屏、光电笔和键盘为工具的图形画线系统得到实现。这套图形画线系统开发和引进了许多计算机绘图的基本思想和技术,使用户可以运用电脑画出直线、复杂曲线以及简单的标准部件。

最初CAD被解释为“计算机辅助绘图”,由于当时计算机在设计上的作用是替代传统手工绘图的一种新工具,但随着后来信息技术的飞速发展,计算机技术在各领域的广泛应用,CAD的含义也在不断变化扩展,随着20世纪70年代像素的产生、80年代三维曲面造型系统的开发等,使电脑绘图从只能用“线”这一基本绘制元素发展到可以用点、面、体进行绘制计算机图形,从而使CAD的含义也发展成现在人们比较熟知的计算机辅助设计这个概念了。1970年的威尼斯双年展首次接纳了计算机绘画作品,这也标志着新的视觉艺术形式的诞生得到了社会的承认。

我国的计算机辅助设计起源于20世纪70年代。与国外计算机辅助设计发展的轨迹相似,国内计算机辅助设计的研究与应用基本上是从各高等院校发展起来的。20世纪90年代初,随着我国现代化进程的迅速发展以及计算机的进一步普及,在环境艺术设计和创作领域,计算机技术应用的价值,逐渐得到人们的重视。

二、我国计算机辅助环境艺术设计的现状

计算机作为信息时代重要的技术工具,在环境艺术设计领域得到普遍应用。在20世纪90年代前,国内对环境艺术设计效果的表现是使用手工绘制的方法,到了20世纪90年代初期,计算机辅助设计技术开始在我国建筑业应用。计算机辅助设计技术在建筑设计表现领域以不可逆转的潮流迅速发展。尤其是到了20世纪末,计算机辅助设计逐渐成为建筑效果表现的主流。起初,设计师主要运用AutoCAD软件进行施工图的绘制,在方案阶段还以手绘为主。但随着相关专业软硬件的更新和进步,它自身的强大优势得以显示,同时对传统手绘表现产生了越来越大的冲击。

随着近十几年来我国计算机辅助环境艺术设计的发展,计算机建筑效果表现的类型己经有了很细致的划分,可以分为:计算机建筑效果图、计算机建筑漫游动画和计算机建筑效果虚拟现实。计算机建筑效果图主要是通过3DSMAX,Lightscape,Photoshop等计算机软件制作的静态的效果图。通过计算机三维软件从平面、立面数据中得到透视图,透视点位置及视点角度均可变换,然后再渲染出二维图像,这种方式是目前社会上应用最广泛的。计算机漫游动画是利用3DSMAX软件的三维动画功能,在建筑物的室内或室外的设计阶段就能以可视的、动态的方式全方位展示建筑物所处的地理环境、建筑物外貌和各种附属设施以及建筑物内部空间的效果,使人们能够在未来的建筑物中漫游,因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。

三、计算机辅助环境艺术设计的发展趋势

当前,随着计算机软硬件技术的迅猛发展,计算机辅助设计在环境艺术设计领域受到了广泛的重视和应用,比如各种方案的汇报、投标以及招商广告中随处可见,从而出现了大量的绘图软件的教程以及在教学上更加重视计算机绘图软件的教学课程。人们更多的关注计算机技术,想方设法掌握各种绘图软件,在模型、材质、灯光以及各种渲染技法上花费大量的时间,而忽略了最终的效果图的艺术性。计算机辅助设计是科学与艺术以及计算机与艺术设计相结合的边缘学科。计算机辅助设计在视觉艺术创造规律、形式法则和审美方法与传统的艺术设计是相同的。所谓视觉艺术,是通过人的视觉感受而将客观内容纳入主观心灵并予以对象化呈现的艺术形态。一些美学研究者认为,从审美主体的角度来看,艺术离不开创造者和欣赏者两个方面,而这两个方面都要通过一定的感官和相应的感性物质媒介,前者创造出审美对象,后者达到审美愉悦。所以说,作为视觉艺术的计算机辅助设计作品既要真实的描绘场景,又要使欣赏者达到审美偷悦。不可否认,人们的欣赏水平在不断提高,求新、求异的视觉口味也越来越高。这源于技术的发展、审美的进步,计算机技术的发展对于社会和艺术创造产生了重大的推动作用。

在计算机辅助环境艺术设计发展的初级阶段,设计师的目标是使效果图具有真实感,能够模拟未来场景的真实效果,具有一定的实用性。目前的计算机建筑效果图的风格单一,已经不能满足大众的不断提高的视觉口味。计算机建筑效果图既是表现的技术同时它又是视觉艺术。设计师创造出审美对象,筑物内部空间的效果,使人们能够在未来的建筑物中漫游,因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。使用的软件有Creator系列三维建模工具及Vega场景管理软件。计算机建筑效果虚拟现实技术强调的是一种身临其境的感觉,采用的是人与人之间自然的交互方式。它可以实现逼真的、纯三维的场景,可以全方位、多角度、完全由用户自由控制在场景中漫游。作为建筑师可以从多个角度观察建筑方案,所以说虚拟现实技术不仅可以使用于建筑表现,而且也是一种推敲方案的有利手段。VR技术在我国的环境艺术设计领域中有着广泛的应用前景,将给环境艺术设计带来革命性的改变。

设计师创造出审美对象,要使欣赏者达到审美愉悦而不是审美疲劳。为此,根据目前我国计算机辅助环境艺术的发展情况,未来计算机建筑效果图应呈现艺术化、人情化和多样化趋势。

参考文献:

[1]邓庆尧.环境艺术设计[M].济南:山东美术出版社.

[2]张绮曼.中央工艺美术学院环境艺术设计系—室内设计的风格样式与流派[M].北京:中国建筑工业出版社.

[3]张绮受.中央工艺美术学院一环境艺术设计与理论[M].北京:中国建筑工业出版社.

第9篇:计算机视觉技术范文

【关键词】计算机;数字动漫技术;电影风格

中图分类号:J99文献标识码A文章编号1006-0278(2015)08-242-01

计算机数字动漫技术已经逐渐融入到电影制作各个环节中,并运用其独特表现手法是的电影表现形式不断丰富,导演可以通过计算机数字动漫技术将画面更加直观呈现于观众面前。电影是一门艺术创作,在电影制作过程中应合理看待计算机数字动漫技术对电影风格造成的影响。

一、计算机数字动漫技术使得电影实现形式与内容的统一

传统观念认为电影必须立足于情感,即影片需要通过其本身蕴含的情感与观众展开互动,观众观看影片实质是其内心世界的情感宣泄,因此电影制作过程中必须通过巧妙的情节设置、扣人心弦的对白、演员出神入化的演技等关键因素来提升电影整体质量,掌握这几大关键因素就掌握了电影制胜法宝。然而随着数字化技术不算被运用于电影制作中,人们对电影传统观念发生变化,计算机所具备的高科技技术能够营造出传统电影技术无法比拟的视觉效果,并征服大多数观众,人们开始打破传统观念,讨论电影形式与内容的关系。从现状开看,电影形式是内容一部分,电影内容也可看做某种形式,只有将形式和内容有机结合在一起才能够创作出具有重要意义的电影。计算机数字动漫技术是一种形式,同时也是一种内容,当因内容导致计算机数字动漫技术无法发挥其表现力时,影片便会显得空洞无力,例如电影《最终幻想》虽然在画面上已经趋于唯美,但由于其内容晦涩难懂,因此难以给观众留下深刻印象。归结其原因是没有注重内容的刻画。再如《最终幻想》和《骇客帝国》这两部影片在类型上同属科幻片,不同的是《骇客帝国》在叙述过程中采取虚拟与现实结合的方式,通过计算机数字动漫技术有效表达出电影主题思想,在视觉中加入一些暗示效果,通过视觉引导观众思想,使得内容和形式互相支撑,在提升视觉效果的同时也丰富并深刻电影内容。

在电影《泰坦尼克号》中观众往往会被男女主角的爱情所打动,但却很少有人知道影片中的灾难场景是通过计算机数字动漫技术来完成的,因此其特效镜头的形式的选择和表现的目的便是恰如其分的表现影片内容。

二、计算机数字动漫技术使得电影风格由“写实”到“表现”的变迁

对当前市场上一些大片进行盘点不难发现当前电影中最具视觉冲击的莫过于高科技动漫奇观,这些动漫奇观主要通过高新技术完成,人们因此享受到前所未有的视觉盛宴,对电影的观念也发生潜移默化的改变。在计算机数字动漫技术探索GG视觉设计的风格是当今电影制作中使用的计算机技术以及艺术方面发展方向。笼统来看可将GG绘制技术分为真实感绘制以及非真实感绘制。真实感绘制已经具有长足历史,非真实感绘制则是在近些年才兴起,主要建立在真实感绘制的基础上,通过这种技术绘制的图像具有明显动漫效果以及艺术效果,由此导致电影形成由真实向非真实转变,电影形成了由写实进化到抽象的技术性基础。随着计算机技术不断发展,到上世纪90年代人们已经能够利用计算机技术模拟出各种特殊效果,这一时代出现众多强烈视觉冲击影片,如《泰坦尼克号》《星球大战》《骇客帝国》等,通过实感图像与电影胶片摄制出图像进行完美结合,真实感图形由此实现了“像照片一样真实”的效果,在电影制作技术上已经不存在太大问题。由于技术瓶颈不断被突破,计算机摄影技术已经开始对电影艺术风格展开,从2006的最佳动画短片《One ratshort》到《罪恶之城》,以及一些一亮相便备受瞩目的黑白动画复活,人们从这些奉化中获得一些启迪。2006年法国国际动画节水晶奖的《复活》这一影片在制作中均采用黑白色彩来表现,展现出一种强烈的视觉效果。其后出现的《方舟》更是在场景以及色彩上达到另一高度,其中的色彩是印象的、表现主义的。

三、计算机动漫技术使得电影超现实化

计算机已经成为电影制作中不可取代的设备设施,电影中强烈的立体音以及各种特技合成均通过计算机完成,电影本来面貌被改变,当前电影画面变得越来越神奇魔幻,人们可以将自己的想象力充分展现出来,并通过计算机数字动漫技术来实现。目前计算机数字动漫技术已经能够达到人们的想象力所能延伸到的任何境界。如电影《斯巴达300勇士》就是一部通过计算机制作出来的电影,该部影片中共有1500个镜头,据统计几乎所有镜头均使用了计算机数字动漫技术进行处理,将电影“拍摄”以及“绘画性”有效结合在一起。影片制作过程中主要利用计算机数字动漫技术后期制作中层理念进行分析,将其艺术效果展现的淋漓尽致,整部影片看起来犹如一幅流动的油画。

当前超现实主义电影追求的最高美学境界就是讲艺术创造视作一种偶然启示或悲伤预言,《斯巴达300勇士》中所有场景均通过计算机数字动漫技术进行后期处理,为保证影片视觉艺术效果一致性,在进行场景处理中主要通过超现实风格化手法,并在画面处理中追求真实感。通过计算机数字动漫技术使得观众在观影过程中能够获得一种梦幻般超现实感,因此影片整体上更具风格统一性。

四、结束语

人们在精神层面需求不断提升造成人们对电影制作水平提出更高要求,电影制作更加依赖于现代高科技手段,计算机数字动漫技术给当前的电影风格的影响是革命性的,不仅提升了电影视觉效果,还提升电影内涵,人们改变对传统电影观点,电影计算机数字动漫技术必将在未来电影发展中发挥不可取代的作用。

参考文献:

[1]王岩.当今电影对计算机数字动漫技术的应用[J].河南科技, 2014(21):11.