公务员期刊网 精选范文 计算机视觉心得体会范文

计算机视觉心得体会精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉心得体会主题范文,仅供参考,欢迎阅读并收藏。

计算机视觉心得体会

第1篇:计算机视觉心得体会范文

1视觉跟踪算法

1.1KCF算法

KCF(KernelCorrelationFilter)核相关滤波算法通过目标样本去训练判别分类器,训练判别分类器分析当前跟踪的目标是被跟踪目标周围的背景信息还是被跟踪目标,如图1所示。KCF通过岭回归分类器的学习来完成对目标的跟踪,通过快速傅里叶变化实现算法的加速运算。KCF跟踪算法在训练阶段,利用循环矩阵理论,对视频目标区域进行稠密采样,获取正负样本,提取方向梯度直方图(HOG)特征,通过岭回归分类器分析所以样本进行训练。在检测阶段,以视频前一帧目标位置为中心进行稠密采样,将得到的所有样本输入到岭回归分类器,经过岭回归分类器的分类,得到目标的位置。

1.2TLD算法

TLD(Tracking-Learning-Detection)目标跟踪算法由跟踪模块(Tracking)、检测模块(Detection)、学习模块(Learning)三部分组成,如图2所示。该算法首先由跟踪模块的作用是将被跟踪目标的运动轨道处理成轨道碎片提供给学习模块进行学习,学习模块根据跟踪模块的处理结果进行学习并对检测模块的错误进行分析,通过学习处理后生成训练样本,检测模块在接收到训练样本后对相关参数和目标模型进行跟新并对跟踪模块重新初始化,其中跟踪模块为中值流跟踪器,学习模块为P-N目标模型学习。

1.3视觉跟踪算法改进

KCF跟踪算法的运行速度方面和在目标环境变化不大的情况下跟踪速度表现优异,但其在被跟踪目标出现遮挡、形变、跟丢后无法找回目标,反观TLD解决了被跟踪目标被遮挡、目标跟丢无法重新找回的情况,因此将两个算法互相融合,取长补短能提高算法的运算速度和追踪效果。融合方法:利用KCF克服TLD的中值流跟踪器的缺点,将KCF替换TLD的中值流跟踪器,能够加快TLD的目标跟踪速度。当被跟踪目标在当前图像帧中消失后,KCF会把盲目地在背景中寻找被跟踪目标,当被跟踪重新出现时,KCF算法依然在背景中寻找被跟踪目标,导致跟踪失败,为了避免这个错误的方法,KCF与TLD融合的算法包含了原TLD学习模块,当判断目标丢失时不再盲目地在背景内寻找目标,当目标重新出现时重新跟踪目标,进一步提高算法的跟踪性能。虽然这两个算法的融合方法很简单,但融合后的算法确实解决了KCF不能跟踪被遮挡的物体以及目标跟踪后不能找回的缺点,而且算法速度上高于原TLD算法,提高了算法的性能和适用性。

2机器人控制系统设计

机器人系统总体框架如图4所示,USB摄像头拍摄到的图像信以视频帧的形式传入到程序中。首先先进行KCF的滤波和特征跟踪,再经由TLD算法的处理运算出目标状态,再通过整合模块把得到被跟踪目标的位置信息转换为云台舵机转动命令发送,通过CH340模块将指令由USB转为TTL电平,机器人下位机通过STM32单片机直接或间接地控制各个模块实现机器人的各个功能。STM32单片机在接收到PS2手柄模块和CH340模块的控制信号后,根据程序存储器对应的指令执行行动,如前进、水弹枪射击等。STM32单片机实时接收各模块的信息,例如编码电机的电机转速,陀螺仪的欧拉角等,根据各模块的信息及时调整机器人的运动状态实现机器人运动底盘的灵活移动。摄像头所拍摄的图像信息并不会直接交给STM32单片机除了,而是先经由上位机NUC通过视觉追踪算法运算过后所得的控制指令发送给单片机接收,单片机接收到通过CH340转换的控制指令后控制舵机云台转动追踪目标。

3机器人目标跟踪算法软件设计

目标跟踪算法软件实现流程图如图5所示。由于该目标跟踪算法的运算结果只返回一个跟踪框,并没有实际的跟踪结果,所以需要获取被跟踪目标所在图像中的坐标,获取包围被跟踪目标的矩形重心后,才能方便实现目标跟踪算法。计算出被跟踪目标的矩形包围框的重心后,先对图像帧区域进行划分,使用渐近式接近目标区域为核心思想,将每一帧的图像划分为许多相同的矩形区域。随后根据KCF+TLD目标跟踪算法运算得出的结果框的重心与图像正中心对比,计算出被跟踪目标与图像正中心坐标的偏移量,再通过舵机控制算法计算出舵机云台的转动量,逐帧接近目标所在位置,达到跟踪效果。

4系统视觉跟踪算法测试

第2篇:计算机视觉心得体会范文

关键词:计算机;图形图像设计;视觉传达设计;异同点;应用

一 前言

从行为方式来分析,视觉传达改变早已出现,然而,如果站在学科角度来分析,视觉传达则为一个新鲜领域。视觉传达指的是将视觉符号作为信息传递的一个主要通道,人们通过视觉符号进行信息交流和信息共享。并且,这也是人们传播信息的一重要方式。据统计,人类约70%的信息都是通过视觉系统所获得的,但是,对外部环境信息作出反应过程中,在人类感官系统中,视觉系统占据着主导位置。若人类借助视觉系统来接受信息,再用另外一感官接受其它信息,若这两个信息存在矛盾时,那么人类将会对视觉信息作出相应反应。

二 关于计算机图形图像设计和视觉传达设计的分析

2.1 概念和设计思路

对新时代的人们来说,其数码艺术早已渗透到人们的日常生活当中,成为十分流行的艺术创作手法,特别是对年轻一代人来说,都热衷大胆进行尝试,从而通过此方式去释放作者的想象力,来表达出自己的内心情感,因此,此种艺术创作手法既简单又复杂。对于计算机图形图像设计与视觉传达设计来说,不仅能够解放设计师双手,而且又能使设计者思维更富有其弹性,不受技巧框住,不受现有知识所影响,以便创造出更多无意识、不合常规的特殊作品,这势必会成为计算机图形图像设计与视觉传达设计的独特之处。一般来说,人们把视觉传达设计看作为表达人思维的一种手法,特别是在视觉传达设计中,将文字和图像紧密结合,二者相互补充,衬托出对方的优势,因此,视觉传达对符号设计时,要尽量将而这加以优化,充分发挥出符号优势,从而将整体予以转达。

2.2 设计手法和设计技术

随着时展的进步以及行业发展内在需求,因此,我们要充分认识到电脑和设计二者之间的联系,将计算机变为设计工作者的一重要设计工具,表达设计者的设计理念,再分享给人民大众。再加上,信息全球化的高速发展,远远离不开计算机图形图形设计,特别是在广告、电影等发展领域当中,都要求有很强的计算机图形图形设计技术。并且,在设计过程中,设计者也可以借助各种工具软件,适当调节图形图像的清晰度,从而给观众良好视觉感受。

三 关于计算机图形图像设计和视觉传达设计异同点

3.1 相同点

计算机图形图形设计和视觉传达设计过程中,一般会应用到Photoshop 软件,它是Adobe 公司开发的一个跨平台的平面图像处理软件。PS 的专长用于图像处理,而不是图形创作。图像处理是对已有的位图图像进行编辑加工处理以及运用一些特殊效果,其重点在于对图像的处理加工。大多数内容都是难以区分的,换言之,它们的共同点是非常多的。比如:在专业课中,都会涉及到绘图、色彩等知识,在此方面的学习具有相同点,而且,在现代设计思路、创作方式都是互通的,对点、面、体等的排列原则也都是相同的。

3.2 不同点

3.2.1 目标任务不同

视觉设计工作者的目标任务是为找寻美感,打造良好的设计形象,熟练掌握媒体动态所产生的;但是,计算机图形图像设计目标任务是把动态和静态紧密结合,塑造二维和三维空间所产生的。

3.2.2 技术方法不同

视觉传达设计除要对核心技术进行学习之外,对理论知识学习也要引起高度重视,因此,视觉传达设计相对比较枯燥、乏味,但是,计算机图形图像设计相对十分有趣,除要学习专业课程之外,对视频编辑等内容的学习也是非常重要的。

四 当前计算机图形图像设计和视觉传达设计的应用探究

4.1 包装设计

在市场或者是超市当中,新颖、特别包装设计会可以吸引消费者眼球。因此,对于视频和服装包装远远离不开计算机图形图形与视觉传达设计。包装成为实现使用价值的一个重要手段,不管是在书籍封面或者是各种宣传彩页的制作,上述这些带有良好视觉传达的商品,通常都和计算机图形图像设计有关,对思想性与知识性予以重新认识。其中,色彩、透明度等的不同都会传达出不同视觉效果。

4.2 广告与影像创意设计

在广告和影像创意设计当中,都远远离不开计算机对图形图形的处理,在经过处理之后,便会带给大众各种不同创意效果。可以说,创意设计为艺术设计的一个枝干,但是,这种设计往往不带有商业性目的。然而,因创意设计能够为设计爱好者提供更为广阔空间,所要,大量设计工作者学习计算机图形图像设计知识,表达出各自不同的视觉创意。

4.3 插图和绘画设计

因计算机图形图图像设计拥有绘画和调色的功能,因此,大量插图工作者首先利用铅笔来绘制草图,再借助图形图形设计软件来绘制插图。另外,近几年来,像素画极其流行,从而使更多设计者能够通过图形图形设计来创作自己个性化作品,并且,此类作品有较强视觉冲击力。

五 结束语

总体来说,在当今信息高速发展的时代,科学技术成为国家进步的主要力量。而在我国各行各业当中,计算机图形图形设计和视觉传达设计应用十分广泛。因此,我们只有在对现有技术加以改革,认真对视觉传达设计进行研究,将计算机图形图形技术为人们的生产和生活服务,为社会发展贡献一份力量。在现今领域中,都充满巨大挑战,因此,计算机图形图形设计必然会更好的适应社会发展,尤其是在于视觉传达设计的结合更为重要,二者相互影响,相互促进。我们坚信,在不及的将来,必然会有新突破,

参考文献

[1]郑刚,辛欢.计算机图形图像设计与视觉传达设计[J].兰州工业高等专科学校学报,2004(2).

[2]范丽萍.计算机图形图像设计与视觉传达设计[J].电脑编程技巧与维护,2012(4).

[3]金波.数字时代视觉传达设计的构成关系浅释[J].美术大观,2007(4).

第3篇:计算机视觉心得体会范文

【关键词】机器视觉;VisionPro;识别定位;

1.引言

自20世纪80年代以来,机器视觉技术开始高速发展,已经从实验室走向了人们生产生活的各个方面。机器视觉系统的特点是提高生产的柔性和自动化程度。在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉;同时在大批量工业生产过程中用机器视觉检测方法可以大大提高生产效率和生产的自动化程度。而且机器视觉易于实现信息集成,是实现计算机集成制造的基础技术。现今,在机器视觉领域已经有了一些成熟的视觉开发软件,其封装了很多可靠、高效的算法和工具。本文选用美国康耐视公司的VisionPro软件,这是一套基于PC架构的视觉系统软件开发包,主要应用于各种复杂的机器视觉领域。它集成了用于定位、检测、识别和通讯等任务的工具库,可用C#、VB和VC等语言进行二次开发。本文基于VisionPro利用语言进行视觉定位系统的软件开发[1]。

2.视觉定位系统

2.1 硬件组成

在图像处理前首先要得到清晰、有效的图像,这就需要有一套完整的硬件设备。一般主要包括照明用的光源、调节图像清晰度的镜头、将图像转换为数字信号的摄像机和进行图像处理的计算机。其中摄像机与计算机之间的接口也比很重要的,主要分为IEEE1394和采集卡,USB2.0或Gigabit Ethernet千兆网三种[2]。

本视觉系统采用的是日本FUJINON工业摄像头,德国BASLER工业像机ACA1600-20GM,GigE千兆网接口。

2.2 基于VisionPro的软件开发

本视觉定位系统利用编写适合实验需要的界面,界面中只包含需要的操作功能和数据,使整个界面看起来更加清楚简单,操作起来更方便。

(1)图像采集

本视觉系统通过GigE千兆网作为接口控制相机进行图像采集。打开软件并连接相机,设置好参数后,就可以通过可视化工具Image Source直接获取图像。

(2)相机的标定

机器视觉的基本任务之一是从摄像机获取的图像信息出发计算三维空间中物体的几何信息,并由此重建和识别物体。空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系是由摄像机成像的几何模型决定的,这些几何模型参数就是摄像机参数。在大多数条件下,这些参数必须通过实验与计算才能得到,这个过程被称为摄像机标定[3]。

本文利用VisionPro的CalibChecker-boardTool工具进行摄像机标定。首先需要一个棋盘板,棋盘板必须满足以下条件:必须由大小相同的黑白格子交替组成;格子最好是正方形,如果达不到的话,格子长宽比也要在0.9和1.0之间。本系统采用康耐视公司提供的标准棋盘板进行标定[4,5]。图1是标定的结果。

(3)目标识别与定位

视觉定位的目的就是找出目标物的坐标位置。本文利用VisionPro的PMAlignTool工具对目标物体进行识别定位。PMAlignTool工具是基于PatMax算法,该算法采用模板定位技术(pattern-location technology),先训练模板,然后根据模板对采集图像进行模板匹配,实现定位。在训练模板和定位过程中,PatMax不是基于像素栅格(Pixel grid)分析图像,而是采用基于几何外形(Features based)的定位方法,通过图像的几何特征信息和特征之间的空间位置关系进行模板训练和匹配,使其能够保证很高的精度和抗干扰性,而且可以高速定位发生旋转、缩放、甚至拉伸形变的物体[1]。PMAlignTool工具定位的流程如图2。

通过PMAlignTool工具对目标物体识别定位后,利用VB调用该工具下的Results.Item(i).GetPose().TranslationX和Results.Item(i).GetPose().Transl-ationY。这两个值就是序号为i的目标物在图像上的X、Y坐标值,其中i为识别的各个目标物的序号。

3.实验

3.1 PatMax识别定位

在对摄像机完成标定校正后,运用自己编写的人机交互界面完成对目标物体进行识别定位,并将所需要的目标位置坐标显示在界面上。同时又将识别到的所有目标物体的坐标信息保存到了文本文档中,方便调用。主要操作如下:

(1)模型训练。实验以一元硬币为目标物,图3为训练完成的模型。

(2)目标识别定位。图4是利用编写的界面,在图像上能够清楚的显示出所识别出的目标轮廓和形心位置,界面右方结果显示区内可以看到所识别的目标数量和所需要的目标物的坐标。

3.2 对比实验

视觉定位可以用的软件和工具包很多,其中应用最广泛的就是Opencv,它是一个基于(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。为了验证PatMax算法定位的准确性,本文利用Opencv对相同的图像进行目标识别定位,对得到的效果图和坐标进行对比[6]。如图5所示,其中蓝色为轮廓曲线,绿色十字为目标形心。

图6为VisionPro识别硬币的效果图,轮廓和形心均用绿色线标识。对比两图可以看出VisionPro对轮廓的识别效果要更好一些。由于形心坐标是由轮廓曲线上的点计算得到的,所以VisionPro获得的形心坐标值也会比Opencv的更加准确,而且精确度更高。下表是两种方法得到的形心坐标。

4.结束语

本文基于VisionPro采用对其进行开发,首先利用VisionPro中的工具进行图像的采集,摄像机的标定,运用PatMax算法进行目标物的识别与定位,然后运用编写人机交互界面,可以更加方便快捷的得到所需要的目标物坐标值。本文利用Opencv对相同的图像进行目标的识别定位,与VisionPro得到的结果进行实验对比。结果证明基于VisionPro的视觉定位系统对目标的识别效果更好,定位的数据更加准确。基于该软件使应用程序的开发更加快速方便,得到的数据结果误差较小,具有应用价值。

参考文献

[1]威洛斯,焦宗夏.基于VisionPro的焊膏印刷机视觉定位系统[C].第十二届中国体视学与图像分析学术年会论文集,2008.

[2]Carsten Steger,Markus Ulrich,Christean Wiedemann,著.机器视觉算法与应用[M].杨少荣,吴迪靖,段德山,译.北京:清华大学出版社,2008.

[3]邱茂林,马颂德,李毅.计算机视觉中摄像机定标综述[J].自动化学报,2000,26(1):47-59.

[4]Cognex,Cognex MVS-8100D and CDC Cameras Hardware Manual,2006.

[5]Cognex,VisionPro,Net Help,2006.

[6]Bradski G.,Kaehler A.著.学习OpenCV[M].于仁琪,刘瑞祯,译.北京:清华大学出版社,2009.

作者简介:

韩庆瑶(1953—),男,华北电力大学教授。

张志远(1986—),男,华北电力大学能源动力与机械工程学院硕士研究生。

第4篇:计算机视觉心得体会范文

[关键词] 计算机;数字技术;电影;发展

计算机技术的发展,使我们生产、生活的各个方面都发生着巨大的改变,在电影的领域也是如此。电影与科技发展密切相关,我们甚至可以说,电影发展史便是电影技术的发展史。每一次电影世界里的大变革,往往是以科学技术为先导的,其里程碑式的作品必定是新科技成果的展现并取得较大成功的范例。没有任何一门艺术形式像电影这样与电脑技术有着如此息息相关的联系。计算机数字技术的发展,为电影创作提供了丰富的手段,为电影创作者提供了广阔的创作空间,其想象力得以充分的发挥,从而为我们带来视觉盛宴。

毋庸置疑,电影已经进入了数字时代,数字技术是指借助一定的设备将各种信息转换为计算机能识别的符号系统,之后再借助电脑对信息进行运算、传送、还原的技术。大量使用数字技术的科幻大片《阿凡达》的导演詹姆斯•卡梅隆说:“视觉娱乐影像制作的艺术和技术正在发生着一场革命。这场革命给我们制作电影和其他视觉媒体节目的方式带来了如此深刻的变化,以至于我们只能用出现了一场数字化文艺复兴运动来描述它。”[1]

在数字技术中,有一项是电影界最常用的,也是能给我们与传统电影画面完全不同的绚丽画面、宏大场景的,就是3D技术。“3D是three-dimensional的缩写,就是三维图形。在计算机里显示3D图形,就是说在平面里显示三维图形。不像现实世界里,真实的三维空间,有真实的距离空间。计算机里只是看起来很像真实世界,因此在计算机显示的3D图形,就是让人眼看上去就像真的一样。”众所周知,计算机屏幕显示的是平面的,也就是二维的,我们之所以能够看到三维图像,是因为3D成像原理是依据人两眼的视觉差,人眼看到的东西总是近大远小,从而形成立体感,另外,人的两眼球之间会有一段大概8厘米左右的距离。所以,想要使人看到3D影像,必须让左眼和右眼看到不同的影像,在计算机屏幕上因色彩灰度的不同而使人眼产生视觉上的错觉,画面实际上也有一段差距,所有这些只是模仿人类真实双眼看到的情况。从另一个方面看,可以说电脑3D技术是虚拟三维技术,它只是看起来像三维罢了,利用计算机的运算达到视觉立体效果,使二维平面变为立体的,是非实体、虚拟的。而这种虚拟会给观众带来真实感,自然需要计算机无数次的精密运算、专业人员无数次的修改等。

总之,计算机技术与电影艺术的广泛结合,给我们带来了巨大的冲击力,现在普遍使用的3D技术所带来的视觉享受,在以往的电影中是无法找到的,计算机技术加入电影世界,形成了令人震撼的表现力,也带来了前所未有的吸引力。随着3D技术广泛应用于电影,现在的电影与传统领域的电影已经大大不同,观众已经适应了这种视觉张力,哪部电影没有这样的图画,会让人感到什么地方不一样。随着计算机技术的发展,电影随之会有更大的发展空间。

数字技术对传统电影的改变,主要表现在制作方式、表现手段、生成方式、电影题材、存储介质、接受渠道、观众心理等方面,另外,电影之外的附属品,如电影审美价值判断以及电影本体论等也都产生了巨大影响。数字技术在电影中的运用无疑是电影产业产生以来的重要变化之一。可以说,数字技术是对电影产生重大影响的技术革命,以下我们从计算机数字技术带来丰富的电影样式、使得虚拟世界的表现逼近真实、使传统电影的叙事性弱化、转而以画面、音效等吸引观众等三个方面来论述说明。

第一,计算机数字技术带来丰富的电影样式,使电影极大地延伸了题材范围,使新的表现对象进入电影文本。科幻电影、动画片、灾难片、动作片、探险片等,有了计算机数字技术的加入,都得到了巨大的发展。数字技术使科幻世界成为视觉真实,并使科幻片确立了牢固地位。数字技术让动画片获得了新生,传达了与传统动画片不同的内涵,动画片不仅仅是儿童的专利,已经跻身于主流电影行列。数字技术让虚拟世界真实再现,为观众提供了巨大的想象空间。

计算机数字技术催生了动画片,并使之发展与成熟。动画片在数字技术的支持下获得了新的生存空间,众所周知的20世纪40年代,迪斯尼曾经创造了一个动画黄金时代,我们耳熟能详的、经典的如《米老鼠和唐老鸭》《猫和老鼠》《白雪公主》《木偶奇遇记》等。但这些传统的经典在没有数字技术介入之前,都是从教育的角度去创作的。数字技术介入之后,动画片不再只是儿童的专利了。1995年迪斯尼与皮克斯动画联合推出的《玩具总动员》是第一部全部采用三维动画技术制作的动画片,片中所有的图像全部在电脑中生成。令人震惊的是《玩具总动员》上映后,仅3天时间就获取了5 700万美元的票房收入,充分证明了,这部动画片不仅仅是面对儿童市场,它也成为迪斯尼公司赚钱最快的动画片。

计算机数字技术,还使得动画世界中出现了真人的形象,动画与真人的结合表演,开拓出了一个崭新的艺术空间,给观众更丰富的视觉体验,电影形式得到了丰富和发展。计算机数字技术不仅把动画人物与真人表演完美融合在了一起,更重要的是它让传统的二维动画具有三维立体感。例如,《侏罗纪公园》运用3D技术创造出了各种活灵活现的恐龙,而这些恐龙与真人的表演,就像它们真的存在于那里。为了使虚拟的环境中创造出逼真的视觉效果,这部电影运用了110台高性能电脑和数百名电脑工程师,建立了2 000多个关节可以灵活转动的立体模型。其人物表情的丰富与皮肤的质感、技术创造的逼真效果、高超的造型、有层次的色彩等,使得这部影片赢得了3亿6千万美元的票房收入。

总之,这些由计算机数字技术带来的新表现领域,采用多种形式的计算机技术,或是三维的动画技术,或是二维、三维相结合的手法,使得动画片达到了逼真的艺术效果,并获得了广大成人观众的认可。人的无限想象能力,在这些影片中得到了实现并能够得到完美的展现。在计算机营造动画人物技术上的创新,完善电影的技术手段,发展影片的画面美观等方面的种种努力,使得这些以追求逼真画面、表现人类想象及技术展示为目标的动画片渐趋成为大人们的专利。我们不得不说,计算机数字技术让传统动画片焕发出新的生命力,并使之获得了较高的地位,在主流电影类型中占有一席之地。

第二,计算机数字技术的应用,使得虚拟世界的表现逼近真实。虚拟现实是1989年由美国的兰尼尔最早提出的,他认为,“虚拟现实是用计算机技术生成一个逼真的三维视觉、听觉、触觉或嗅觉等感觉世界,让用户可以从自己的视点出发,利用自然的技能和某些设备对这一虚拟世界客体进行浏览和交互考察。”[2]电影《阿凡达》的上映,为人们提供了直接接触虚拟世界的机会,越来越多的人开始了解并熟悉虚拟现实技术。它不仅给观众带来了一场震撼的视觉盛宴,也给电影世界带来了一场虚拟风暴。“虚拟现实技术是由交互式计算机仿真组成的一种媒体,能够感知参与者的位置和动作,替代或者增强一种或者多种感觉反馈,从而产生一种精神沉浸于或者出现在仿真环境中的感觉。”

我们可以说,虚拟现实技术是一门复杂的综合技术,它涵盖了众多学科的众多技术,如计算机图形学、仿真学、多媒体技术、网络技术、人工智能技术、传感技术等。虚拟现实技术中最主要的是表演捕捉技术,简单来说,表演捕捉技术就是通过捕捉演员的表演,再将真人演出影像与电脑动画结合,使虚拟人物符合人类的表情,创造出真实的虚拟人物表演,使动画的虚拟人物造型、表情等接近真人。捕捉的对象包括演员的肢体动作、面部表情,它们可以自由套进不同的虚拟角色中,创造更广阔的表演空间。例如,面部表情的捕捉,在演员表演时,头上戴上精密摄像仪器,将演员面部表情传给计算机,精密到连眼神上的细微变化都不会错过。这些数据经过计算机的一系列运算,再传输给虚拟角色,使之具有真人的各种表情、动作。

总之,虚拟现实技术使电影制作方式打破了传统的电影制作的模式。在这种模式下,影片的前期准备、中期拍摄和后期制作可以同时进行。我们在电影世界中,能够获得空前的听觉上、视觉上、情感上、想象上的审美体验,电脑的参与、科技的发展,使得人们在惊叹的同时享受美。

第三,计算机数字技术使得传统电影的叙事性弱化,转而以画面、音效等吸引观众。传统的电影都是以新奇的故事和曲折的情节来吸引观众,其中的佼佼者必定是在情节上能够得到广泛的认可,情感上得到广泛的一致。计算机数字技术的发展,为电影带来的全新的视野,故事的叙事性逐渐弱化,取而代之的是宏大的场景、虚拟的空间、非凡的人物等等画面和音效的全方位的冲击,给人以视听新感受。这种巨大的转变,一方面为观众带来了全新的体验,一种新的美学享受;另一方面,传统题材与形式的电影似乎丧失了生命力,变得毫无魅力。数字技术介入电影制作,不仅使传统的故事情节主线从影片创作的中心开始向边缘退位,它也让我们给电影重新定位,电影已经不是靠几个演员、几台摄影机就能制作出来的了,而是需要借助精良的设备、高超的技术,来完成多方面的综合,达到现实与虚拟的结合。数字技术的参与,使电影可以更大程度地展示美学特性。现在是视觉媒体的时代,电影应该顺势而为,新的计算机数字技术允许电影向真实性的极限挑战,创造新的银幕奇观,最终给人们带来前所未有的视觉体验。

现今的电影市场上,很难看到没有数字技术参与的电影。因为,计算机技术已经并迅速地改变着电影的一切。电影的制作、载体的形式、传输的手段,无一不融入电脑技术。电影的发行和放映也不再以原始物理的方式进行。令人目不暇接的3D画面,带给观众的感受是革命性的。数字技术对于电影已不仅仅是技术的革新,是全方位的改变,这是电影发展过程中不可回避的事实。传统的电影已经大大让位于新型的电影,人们的观念也发生了根本的转变,计算机数字技术已经不再是吸引人们眼球的卖点,而是电影中必不可少的一部分。

综上所述,电影与科学技术的结合,开创了电影制作的新纪元。计算机数字技术与3D技术参与电影制作与其他各个步骤,借助于计算机、多媒体、互联网等数字技术的发展,电影将完成电影发展历程上根本转变。相信在未来计算机技术的不断发展的催化下,电影也将会得到空前的发展。

[参考文献]

[1] [美]托马斯•A•奥汉年,迈克尔•E•菲利浦斯.数字化电影制片[M].施正宁,译.北京:中国电影出版社,1998:19.

第5篇:计算机视觉心得体会范文

关键词:多媒体教学技术;计算机基础;心理基础;教育基础自

20世纪中叶以来,教育教学受到信息技术的极大影响,产生一系列变革。传统的教育模式与教学方式被改变,多媒体等技术在课堂教学中的普遍使用便是一个很好的体现。在多媒体技术的飞速发展背景下,我国教育的各个领域势必会受到极为深刻的影响,不断实现从教学目的、教学内容、教学形式到教学方法的全面变革。由于人类在对多媒体教学进行加工之时所采用的方式是完全不同的,这就对多媒体教学过程中心理机制及教育基础的探索提出较高的要求,保证多媒体教学过程中学习者及教育者主体性的考虑。

1多媒体技术—教育现代化的必然选择

学习是对认知结构进行组织与重新组织的过程,原有的认知结构与新的学习内容之间存在着密切的联系,新的学习内容以原有认知结构为基础,又会推动原有的认知结构产生变化,而认知结构的改变又以学习与新发现为前提。对于学习者而言,启发式课堂教学遵循“观察事物—发现规律—修正猜想—形成想象—语言解释”的过程,强调学生的发现与理解。传统课堂教学大多形式单一,模型图标、板书以及实物演示等教具虽然可以提供直观现象供学生观察,但其平面性与单调性很难满足教师与学生的要求。现代多媒体教学技术有利于对传统教具不足的弥补,其通过计算机对文本、图像、声音、视频等信息进行综合处理并建立逻辑关系,向学生提供多元化且具有立体感的信息,对其视觉、听觉与触觉等予以充分调动,实现记忆效果的增强,让其在生动形象的直观表达中丰富感性认识,形成心理定式。由此可知,多媒体技术较之传统教学手段来说有着极为明显的优势,是时展背景下现代化课堂教学的必然选择。

2多媒体教学技术的基础

2.1计算机基础

多媒体技术的集成化、多维式、整合性、分布式以及数字化等特征较为鲜明,在实施具体教学工作之时,也以这些特征的发挥为基础。在教学领域内,多媒体技术可以向地理位置与时间安排各不相同的用户提供差异化的综合性信息服务,帮助其克服各项障碍,实现教与学的目的。由此,在分析多媒体教学技术所具有的计算机基础之时需对计算机技术、人际关系、人性化系统及用户至上等观念加以重视。在利用多媒体开展各项教学工作之时,学校与教师通常会将多媒体计算机视作其教学载体。但是对于庞大的多媒体系统而言,这一教学载体仅仅是其中的一个分支,其作为多媒体的一种狭义范畴而存在。多媒体教学工作之所以会对多媒体计算机予以应用的主要原因在于计算机有着强大的扩展性,这是它作为单一媒体区别于电视与音响的最大特性。现有科技水平决定,计算机在加上适当的部件之后会增加一些媒体功能,对媒体教学而言,这是十分简便与经济的,还能够对多媒体教学功能予以胜任,因此会以一种优质技术设备的身份得到学校的广泛应用。多媒体计算机的发展日新月异,它会使计算机的使用与操作同人们的日常生活更加接近,赋予人们用多种媒体技术进行信息交换的权利。在多媒体计算机技术的支撑作用下,声音、光学以及动画等媒体均可被家用电脑用于信息的交换,对于教育教学工作来说,这些媒体的应用前景与发展空间极为广阔。对文字、图像、视频以及声音等的传播是多媒体教学软件所具有的主要功能,这些媒体的制作是多媒体教学软件制作的技能基础。

2.2心理基础

多媒体教学技术的出现在很大程度上拓展了人们以视觉模式为支撑对各种材料进行呈现的具体方式。视觉材料所涵盖的内容比较多,有文本、图像、视频等可供人类视觉观看的各项信息。在视觉媒体技术数字化的整合下,这些信息会转化为多媒体信息。人的视觉心理基础的顾及是学习者更易于接受多媒体教学技术视觉材料的前提,亦即视觉媒体技术多媒体教学目标的实现以视觉心理机制为基础。此处需要把握3点内容:(1)对光的物理三属性所引起的视觉心理机制加以分析。光能够对视觉产生刺激,是一种范围很广的电磁波,但是,人们可以看到的电磁波仅仅是电磁波的一小部分。不同的波长会给人们带来差异化的色调认知,进而使人们产生不同的色觉。其实,色觉还同人自身所感受的明度与饱和度有着不小的相关性,其中,明度所反映的是光波的强度,饱和度所反映的则是光的纯度。基于此,在进行视觉媒体的设计之时,多媒体教学技术要对可见视觉、色调、明度以及饱和度等进行充分且良好的处理。(2)对感光物质的视觉感受器心理机制加以分析。在视网膜上有一些细胞,是真正的感光器官,且各自分工明确,其中锥状细胞所反映的是光的颜色,棒状细胞所反映的则是光的明度,两类细胞有着化学性质不同的感光物质。多媒体教学技术在设计视觉媒体时需要对这些不同的化学性质进行研究。(3)对视觉过程加以分析。在开展视觉媒体的设计工作之时,多媒体教学技术还要对视觉感受野及不同信息所具有的特征进行很好的利用。多媒体教学技术中的视听紧密相连,听觉材料主要由语言、音乐、效果声等内容共同组成,通过媒体技术的数字化整合,这些内容会转化为多媒体信息。类似地,人的听觉心理基础是学习者更易于接受多媒体教学技术听觉材料的前提。此处需要把握两点内容:(1)对声音物理三属性所引起的听觉特性加以分析。声音属性亦有3种:音调、音强与音色。不同的音调会给人带来差异化的感受,在20~20000Hz的声频范围内,感受性较好的音调在1000~4000Hz之间,这取决于耳膜神经纤维对振动频率的承担能力。分贝(dB)是测量音强的有效单位,两个声音之间的强度比率为1∶1.26,这一比值能够保证对两个声音振幅区别的清楚辨别。当音调与音强相同之时,基音与陪音的比例配合对音色起到决定性作用,若比例为整数倍数,会发出乐音,若为非整数倍数,则会发出噪声。故而,在进行听觉媒体的设计之时,多媒体教学技术要对音调、音强与音色进行良好利用。(2)对听觉感受也加以分析。同视觉神经细胞一样,听觉神经细胞也有着各自的分工,以往的研究工作指出,听觉中枢神经细胞中有40%的神经细胞只对噪声进行反映,它们没有反映音乐的功能,而另外60%亦分工不同。冲动频可以出现在声音发生或消失的不同过程或瞬间,且其变化时间较为自由,既可以在音频降低时,也可以在音频升高时。总之,听声音并非简单的录音,在对听觉媒体进行设计之时,多媒体教学技术要对听觉感受也进行把握,并对乐音与噪音的特征予以反应。

2.3教育基础

教育工作以人为服务对象,在教育过程中,多媒体教学技术的应用应对为人服务的宗旨予以充分体现,将其出发点定位在对学习者与教育者的需求考虑上。多媒体教学软件以计算机为基础,在具体的开发过程中应对视觉、听觉、触觉等多种媒体数据进行正确的分析与处理。具体地,软件开发包括两个环节:设计与制作。多媒体教学设计将活动分为课堂型、课外型与知识扩展型3种类型,其软件设计工作应以教学实际为出发点,以3种教学模式为依据进行教学软件的编制,其中,前两种为课程软件,后者为参考软件。多媒体教学软件的制作需要软硬件环境的共同支撑,遵循立项、写本、编辑、加工、整合、开发等流程与教育性、可调节性、因材施教、非结构化教材等原则,借助某种算法语言与不同工具,制成相应的课件,向教学活动提供多媒体教学材料。多媒体创作工具可以对文本、图像、视频以及声音等多媒体信息进行集成处理与统一管理,其多媒体应用的生成可以满足用户的具体要求。现有的多媒体创作工具主要有交互式流线或图标编辑控制型、描述式页控制型与时间流程型3种类型。由于多媒体教学软件有着比较多的类型,例如教育型、演示型、百科全书型以及娱乐型等等,且不同的多媒体创作工具有着不同的适用范围,因此在选择创作工具时,应以具体的需要为依据进行不同类型的选取,以保证高质量教育软件的创作。基于教学训练,尤以复杂技能与特殊专业训练为主的需要,虚拟现实得以出现,很多现代教育(例如医学、建工、航空等)若对虚拟现实技术予以采用,都会极大地提高其教育教学质量,这是虚拟现实技术的教育基础。

3结语

多媒体教学技术的发展对多媒体教学的发展产生了极大的影响。以往学者们更多关注的是多媒体教学的具体技术,尚未投入较多的精力对学习者与教育者这一“人的因素”进行应有的研究。相对而言,对多媒体教学各项基础(计算机、心理、教育等)的探索更应被视作研究工作的重中之重,其原因在于人类是采取多种不同方式来对多媒体教学进行加工的。对多媒体教学技术心理机制与教育基础等的研究有利于多媒体教学更多地考虑学习者与教育者的主体性。

[参考文献]

[1]赵凡.多媒体技术及其教育应用[J].科技信息,2012(3):315.

[2]王玉英.多媒体技术基础课程教学改革探索[J].内蒙古财经大学学报,2014(6):95-97.

第6篇:计算机视觉心得体会范文

关键词:计算机专业教育;图形学;图像处理;多媒体;教学改革

中图分类号:TP391,G642 文献标识码:A

文章编号:1672-5913 (2007) 24-0080-05

1对图形图像与多媒体知识的要求

1.1CC2004知识领域要求

在CC2004中,和图形图像与多媒体相关的知识领域是人―机交互(Human-Computer Interaction -HC)、图形学与可视计算(Graphics & Visual Computing-GV)、信息系统(Information Management -IM)、网络计算(NetCentric Computing-NC)等几个部分。表1是CC2004列出的五种课程计划中所含人―机交互和图形学与可视计算两个计算机主题的比重。表中的数字表示对应的专业与相应的知识域的相关性,范围从0~5。其中,min值表示该学科报告中列举的学生对相应知识域掌握的典型的最低要求,也是相对于其它专业最低要求的值,max值表示该专业学生对相应知识域掌握的典型的最高要求。

表1 计算机主题的比重

分析CC2004中各课程计划和表1可得出,CC-CS2001对图形图像与多媒体的知识要求最高,所涉及的具体知识单元见表2。

表2 和图形图像与多媒体相关的知识单元

CC-CS2001在附录B的课程描述中,推荐了一些覆盖知识领域和单元的课程,每门课程里对预备课程、课程提纲、覆盖的知识单元、各单元学时做了较为详细的描述。相应地,和图形图像与多媒体有关的中介课程有CS250W人机交互和CS255W计算机图形学等课程,高级课程有CS352图形用户接口、CS355高级计算机图形学、CS356图像处理等课程,但高级课程只给出课程名称,还没有详细描述。

CS250W人机交互课程要求全面介绍人机交互原理和技术,CS255W计算机图形学课程则要介绍计算机图形学的原理和技术,两门课程覆盖的知识单元见表3。

表3 CS250W和CS255W的知识单元

1.2CCC2002和教指委计算机科学规范的要求

CCC2002同CC2001一样,把计算机科学与技术学科的知识体系划分为知识领域、知识单元和知识点等三个相互关联的层次结构。完整的本科课程体系结构由三部分组成,即奠定基础的基础课程,涵盖知识体系大部分核心单元的主干课程,用来完备课程体系的特色课程。根据我国计算机科学与技术学科教育的现状及对典型课程设置的分析,给出了16门课程,分别为计算机导论,程序设计基础,离散结构,算法与数据结构,计算机组织与体系结构,微型机系统与接口,操作系统,数据库系统原理,编译原理,软件工程,计算机图形学,计算机网络,人工智能,数字逻辑,计算机组成基础,计算机体系结构。在教指委的《计算机科学规范》中,也选取部分知识单元组成了15门核心课程,分别是计算机导论,程序设计基础,离散结构,算法与数据结构,计算机组成基础,计算机体系结构,操作系统,数据库系统原理,编译原理,软件工程,计算机图形学,计算机网络,人工智能,数字逻辑,社会与职业道德。可见,计算机图形学都为核心课程之一。

在《计算机科学规范》中,计算机图形学和可视化计算可以划分成以下四个相互关联的领域:

(1) 计算机图形学:计算机图形学是一门以计算机产生并在其上展示的图像作为通信信息的艺术和科学。它有以下几方面的要求:①表示信息的模型的设计和构建应有助于图像的产生和观察;②方便用户使之能够通过精心设计的设备和技术与模型(或者说观察到的图像)进行交互;③能提供绘制模型的技术;④设计出有助于图像保存的技术。计算机图形学的目标是对人类的视觉中心及其他的认知中心有进一步深入的了解;

(2) 可视化技术:主要目标是确定并展示存在于科学的(如计算和医学科学)和比较抽象的数据集中的基本的相互关联结构与关系。展示的主要目标则应当是发掘在数据集中潜在的信息,从而有助于用户增强对它们的理解。虽然,当前的可视化技术主要是探索人类的视觉能力,但是其他的一些感知通道,包括触觉和听觉,也均在考虑之中,以便通过它们进一步发现信息的处理过程;

(3) 虚拟现实:虚拟现实(VR)是要让用户经历由计算机图形学以及可能的其他感知通道所产生的三维环境,提供一种能增进用户与计算机创建的“世界”交互作用的环境;

(4) 计算机视觉:计算机视觉的目标是推导出一幅或多幅二维图像所表示的三维图像世界的结构及性质。对计算机视觉的理解和实践依赖于计算学科中的核心概念,但也和其他一些学科(如物理、数学、心理学等)密切相关。

CC2004和CCC2002的规范中给出的课程建议规定了每门课程的最小核心内容,包括的这些单元是要获得学位必须具备的相应知识。核心单元不是课程的全部,核心单元是课程最小的部分,但不能构成完整的本科课程,每门课程应当包括来自知识体系中的附加选修单元。核心单元不能仅安排在本科阶段的入门性课程中。许多核心单元属于入门的导论性知识,但这不意味着它们必须安排在低年级的入门性课程中,因为有些导论性的知识,只有当学生具有必需的基础知识后才能接受。另外,引论性课程也可以包括选修单元。所以核心这一说法只是意味着必须具备的含义,而并没有限制它必须安排在那些课程里。

从以上国内外计算机专业推荐的教学计划和设置的课程可以得到,涉及到图形图像与多媒体的内容,一般宜设置计算机图形学、数字图像处理、多媒体技术等课程及相关课程,可涵盖的知识有人―机交互、图形学、图像处理、多媒体技术等基础内容,这样才可基本达到规范的要求。

2部分高校课程开设情况

从网上可查到的清华大学、上海交通大学、中国科技大学等几所高校的计算机科学与技术专业本科生培养教学计划中计算机图形学、数字图像处理、多媒体技术等课程设置情况如表4。

表4 涉及图形图像与多媒体类课程开设情况

从表4可看到,近几年在计算机专业里,国内的大学普遍增加了图形图像与多媒体类课程的课程数量和教学时间。

3 存在问题及教改研究

3.1问题

第7篇:计算机视觉心得体会范文

A系列APU:极智加速 引领视界

7月19日,一场题为“极智加速 引领视界”的体验活动在北京召开,这是继上海、广州和成都之后,AMD A系列APU新视觉体验之旅的收官之站,被着重强调的“体验”二字意味着这将不是一场寻常的产品。不出所料,走入现场,一眼便可发现以“个人智能超级计算机”、“全天计算”、“顶级视觉体验”和“百核加速”等不同主题组成的庞大体验区域,在以上体验区域中,由视频、实物展示与游戏互动等方式带来的感官冲击令人耳目一新。

毫无疑问,不会再有第二种方式比真实的体验能更直接地将新产品的新奇卖点传递给消费者。比起被动、枯燥的数据说明和机械式的产品展示,AMD更乐于邀请消费者亲身参与其中,体验APU这种最前沿的芯片科技散发的神奇魅力。而在产品的介绍与演示中,AMD大中华区产品市场副总裁唐志德也完全摒弃了俗套的讲解,天马行空地以大脑和小脑、逻辑思考与艺术创作的概念来描绘APU的融聚理念。这种不拘一格的营销活动,又何尝不是另一层面的创新?

双重认可:x86技术40年之巨变

对于APU的创新,AMD全球销售副总裁刘君狄如此诠释:“APU是x86处理器诞生40多年来的又一重大突破,它革命性地把多核处理器和独显核心融合在一颗芯片内,同时具有双方的优势,实现CPU和GPU的协同计算,彼此加速,给用户带来全新的加速应用体验。”他同时表示,这也是AMD召开一系列体验式会的初衷。

随着A系列APU的,AMD已经相继推出5个系列的APU产品,它们分别是针对高端、主流桌面以及笔记本用户的A系列,针对入门级用户,主要应用于超轻薄笔记本、高清小本、一体机、HTPC等领域的E系列和C系列,面向嵌入式领域的G系列,以及专门为平板电脑开发的Z系列。

独具特色的创新使得APU系列产品一经推出便大受欢迎,成为市场的热销产品。而新推出的A系列APU在性能和功能上都有了大幅的提升,加上较高的性价比,市场表现值得期待。

珠联璧合:APU开启加速计算时代

用户新需求层出不穷,A系列APU的出现恰逢其时。一方面,以多媒体视觉应用为特点的个性化计算正呈爆炸式增长,在这种环境下,消费者越发关注PC的多任务处理能力与生动逼真的视觉计算能力。为了满足这些需求,AMD A系列APU在一颗芯片上融合了高达4个x86 CPU核心和性能强大的支持DirectX 11的独显核心,具有多达400个Radeon内核和专用的高清视频处理能力。此外,A系列APU也具备诸如手势界面、多显示屏支持、3D娱乐和实时图像稳定等高级功能。

另一方面,IT技术越来越趋于多元化,以串行计算为特点的CPU愈发难以独自胜任复杂多变的计算需求,加速计算技术亟待发展。作为引领下一代加速计算的主力产品,APU革命性地将CPU和GPU融合在一块芯片上,兼具两者的优势,可以实现协同计算,彼此加速,为消费者带来全新的应用体验。全新出炉的高端A系列APU更是具备双显卡、物理四核、智能超频,以及支持第二代DX11的独显核心等技术配置,能够带来全新的用户体验,例如极致视觉性能、智能个人超级计算机、百核加速应用以及全天候计算等。据AMD介绍,目前已有超过50种领先应用程序支持APU加速,包括IE9、Office 2010、Adobe Flash Player 10.1、暴风影音播放器以及众多的视频和图片编辑软件等,通过APU的加速功能,能实现更高效、更流畅的操作和应用体验。

前所未有:极致视觉体验

第8篇:计算机视觉心得体会范文

【关键词】株高 HALCON 双目视觉 误差修正

1 引言

计算机视觉技术是近几年来发展较快的信息处理技术,随着图像处理技术的专业化、计算机硬件成本的降低和速度的提高,计算机视觉的应用已变得越来越广泛,其中不乏在农业中的应用。

株高是植物生长指标的重要参数,是一个物种争夺阳光的能力的主要决定因素[1]。对于作物来讲,株高参数是作物产量预估不可或缺的参数。

然而对于具体的利用机器视觉方法直接测量株高的研究还是比较少的,本文就是利用HALCON软件,采用双目计算机视觉方法来实现株高的测量。

2 双目视觉原理

双目视觉的基本原理是从两个视点观察同一景物,获取不同视角下的两幅图像,然后根据三角测量原理计算不同图像对应像素间的视差(disparity ),获取景物的三维信息,从而实现场景三维重构。

根据两个摄像机位姿的不同,双目视觉有多种模式,常用的有双目横向模式,双目横向会聚模式以及双目纵向模式(也称双目轴向模式)。

为了增加测量精度,基线一般不能太小,但基线长度也不可太长,否则,由于物体各部分相互遮挡,两个摄像机可能不能同时观察到目标点。

图1是会聚双目成像中的视差原理图。图中给出两镜头连线所在平面(XZ平面),两镜头中心间的距离(即基线)是B,两光轴在XZ平面相交于(0,0,Z)点,交角为(未知)。现在来看如果已知像平面坐标点(x1, y1)和(x2, y2 ),如何求取世界点W的坐标(X,Y,Z)。

根据相似三角形的关系可以很明显得出: (2.1)

(2.2)

(2.3)

其中r为从(任一)镜头中心到两系统会聚点的距离(未知)。将式(2.2)和(2.3)联立, 可得:

(2.4)

上式把物体和像平面的距离Z与视差d直接联系起来,若想求解式(2.4),除视差d外,还需要知道x1和x2本身。另外,由图1可以得到:

(2.5)

代入式(2.2)或(2.3)可得:

代入式(2.2)或(2.3)可得:

(2.6)

现实测量中,两相机的光轴与世界坐标Z轴的夹角不可能相等,不过即便如此,也只会引入几个待确定的三角函数,而这些三角函数在相机标定时即可确定。

3 测量过程

实现该测量过程包括如下几个功能模块:图像获取、摄像机标定、特征提取、立体匹配与三维信息恢复、后处理。本实验采用是分比率为960×720的双摄像头。被测区域大小约为56cm×42cm,所以采用的标定板应为被测区域1/3大小的HALCON专用的200mm标定板。标定数为24×2张图片。利用HALCON自带的标定助手,可以轻松实现单目标定。

双目标定时,需要有15张以上左右相机相同时刻拍摄的标定板的图片。再利用for循环,find_caltab函数,find_marks_and_pose函数以及binocular_calibration函数,可以实现双目标定。将标定过程中,获得的摄像机的内参以及两个摄像机相对位置关系作参数传递给函数gen_binocular_rectification_map,可以很好地实现双目视觉校正的目的,得到两幅校正后的图像,还能得到校正后虚拟立体视觉系统中两个摄像机的内参和外参。

不同种类的植物其株高定义不同,测量方式也不尽相同。本文研究的株高只针对直立型的,是指从植株根部露出土壤部分到植株最高处的株高。

先利用gen_binocular_rectification_map函数为map_image函数提供控制参数,再通过map_image函数对采集到的图像做校正处理,利用threshold函数,fill_up_shape函数以及select等函数找出校正后图像中植株的最低和最高点,利用intersect_lines_of_sight函数,可获得植株最低点和最高点的真实三维坐标,最后通过几何运算得到双目测量结果。

我们在图像采集时就应该考虑到,摄像头应该稍微带一点俯拍的角度,保证左右两幅图像上最高处均为现实坐标中的最高处。切忌俯拍角度不可太大,否则由于拍摄角度而引起的像差会很大,对结果将会有很大的影响。

经过以上几步骤得到的三维坐标,常因各种原因而存在一定的误差,需要进行误差校正。我们对已知高度的对象进行了测量,得出结果如表1:

通过上述数据得出的修正关系如下:

y=-0.0002x2+1.0699x (3.1)

其相关系数R2=0.9993

4 实验结果

我们对三种植物进行了测量得出的结果如下:

从测量结果中可以看出,修正后相对误差控制在2%之内,可以接受。误差引入的原因可能如下:

1、标定板的选择决定了标定精度。一定要选用高精度的标定板,且标定板的大小应约为测量范围1/3大小。

2、相机是图像获取的根本,高质量的图像离不开高分辨率相机,但是高分比率,高解析度的相机又会带来成本上的提升。本文中,对于390.0mm左右的对象,1个像素的误差可以带入约0.4mm的实际误差。

3、本文所采用的算法只能针对比较理想,比较直的植株,算法的不断优化,才能不断减少误差,提高精度。

5 结语

本文介绍了一种基于HALCON的,利用双目视觉测量株高的方法。对于直立型植物,通过对立体匹配与三维信息恢复结果的误差修正,其株高测量相对误差不超过2%,方法具有一定的可借鉴性。

参考文献

[1]章毓晋.计算机视觉教程 [M].北京: 人民邮电出版社,2011.

作者简介

郝慧鹏(1988-),男,内蒙古乌兰察布人,硕士研究生,主要研究方向为计算机视觉技术在农作物检测上的应用。

指导老师

田跃(1956-),男,北京人,北京科技大学数理学院物理系教授,北京市弱磁检测及应用工程技术研究中心副主任。

作者单位

第9篇:计算机视觉心得体会范文

计算机平面设计技术的应用给人们的生活增添了许多色彩,同时也让其成为多个领域视觉体验与作品设计的主要部分,不断创新的计算机平面设计技术开始在社会中越来越多个行业中发挥作用,其中色彩语言无论是在平面设计语言表达还是在情感表达方面都起到了不可或缺的作用,因此研究色彩语言在计算机平面设计中的应用具有重要的现实意义。本文主要从色彩语言与计算机平面设计二者之间的应用关系入手,分析了色彩语言的应用与更深层次的应用。

【关键词】

色彩语言;计算机平面设计;应用

一、色彩语言和计算机平面设计间的关系探究

计算机平面设计在社会生活中逐渐具有举足轻重的作用,为了提升其视觉体验效果,不断的发挥色彩语言在其中的重要作用自然无可厚非,因此色彩语言目前已经成为计算机平面设计中的主要角色。可以在应用层面把色彩语言与计算机平面设计两者之间的关系划分为以下两个方面。其一,色彩语言是计算机平面设计中的重要陪衬,例如色彩语言中的一些元素能够直接应用于视频、图像、文字等之中,从而使整个平面设计作品在色彩语言的衬托下展示了更好的视觉效果,达到了商品在审美与实用两个方面相互增值的效果,最终让产品能够被更多的消费者认可与理解;其二,计算机平面设计能够在过程中实现色彩语言的优化与完善。计算机平面设计的过程也是对色彩进行优化使用的过程,其能够让色彩变得更新颖,更高层次发挥色彩的吸引力与感染力,从而实现产品设计的外观与实用性相统一的作用。

二、色彩语言在平面设计中的应用探讨

以平面设计为基础的计算机平面设计被广泛的应用在企业的形象展示设计、产品包装设计、商业广告设计等各个方面。这种以文字、图像等形式作为传播载体的功能设计,能够很直接的传递一个理念以及与企业或产品有直接关系的信息和文化。曾经色彩被简单的当作文字或图形的附属品来使用,后来市场不断提高的竞争力,使得色彩语言成为平面设计方面的有利武器。接着色彩语言就成为了能够很好表现产品或企业个性的主要方式,并在不断的使用过程中占据了设计作品中的主要元素。

三、色彩语言在计算机平面设计中更深意义上的应用

3.1色彩语言在计算机平面设计中的情感应用

色彩作为平面设计作品中画面渲染的主要元素,本来不具备情感特征,只是一种物理的视觉表象,然而将它融入在我们的生活当中时就会引起我们的情感共鸣从而产生情感作用,进而实现平面设计效果上的升级,因此色彩语言能够为平面设计作品的情感表达加分。利用色彩在冷暖感觉上的作用搭配进行色彩选择,能够很好的把产品的实物特征展现给消费者。利用色彩的收缩与膨胀特征加以科学的调配与叠加,能够大大提升设计画面的视觉效果,另外还可以降低长时间的观察给人们带来的视觉疲劳的可能性。如果在设计画面中添加部分带有沉静感的色彩元素,就能够让人的心理变得比较愉悦进而让别人更好接受作品的设计目的,而且各种不同的情感都可以根据不同的色彩进行表达。

3.2色彩语言在计算机平面设计应用中加强效果探讨

通过上文中的相关论述和分析,知道了色彩语言在计算机平面设计中的重要位置,不但是更高层次的展示产品实用性与美观性的关键,而且能够实现消费者情感共鸣的效果,为了提升其在计算机平面实际上的适用范围,我们需要探讨其在计算机平面设计应用中的加强效果。根据不同色彩语言能够通过平面设计作品给人们带来不同视觉体验及情感表达效果的差异性作用,就能够更多掌握色彩语言的灵活性,实现更强的设计效果。为了更巧妙的挖掘出色彩语言在计算机平面设计中的作用,还可以从色彩语言的基础表达和它的含义特征着手,以此来不断提升其在产品设计理念和思路方面的能力,更加直接的给消费者展示商品的基本性能。首先能够通过对设计图最简单的色调调和与选择开始,进而体现商品的冷暖感觉,比较的直接的将商品的实际特征表达给消费者;其次,利用色彩的收缩效果和膨胀效果两个方面的搭配与变化应用于平面设计之中,实现设计画面视觉效果的整体提升,避免短时间内甚至长时间带来的视觉疲劳;再次,就是将沉静感的色彩当作重点,利用能够引起人们心里变化的色彩展示出不一样的表达效果,那么就可以将情感表达的复杂度和深刻度扩大,实现不同的设计体验。因此,色彩语言能够给计算机平面设计带来无限的视觉遐想。

四、总结

本文首先探讨了色彩语言与计算机平面设计两者间的关系,论述了色彩语言在计算机平面设计应用中的重要性,又通过视觉感觉得出了色彩语言能够为平面设计增加情感特征的结论,分析了色彩语言在计算机平面设计应用方面的策略,希望为计算机平面设计在产品设计的表达上呈现出其最初的价值,即实现产品销售的经济意义。

作者:温金辉 单位:港口理工学校

参考文献