公务员期刊网 精选范文 计算机视觉研究的目的范文

计算机视觉研究的目的精选(九篇)

计算机视觉研究的目的

第1篇:计算机视觉研究的目的范文

关键词: 计算机 视觉注意机制 计算机视觉注意模型

1.引言

随着信息技术的不断发展,数据处理量剧增,以及用户不断扩大的个性化需求,对计算机信息处理能力提出了越来越高的要求。如何在场景中快速准确地找到与任务相关的局部信息,即物体选择与识别,已经成为计算机信息处理领域的一个研究热点。随着在心理学领域注意机制研究的不断发展,将注意机制引入信息处理领域来解决物体识别问题,已经不再是纸上谈兵。

人类视觉系统进行视觉信息处理时,总是迅速选择少数几个显著对象进行优先处理,忽略或舍弃其他的非显著对象。进入人类视野的海量信息,通过注意选择机制进行筛选,就能使我们有选择地分配有限的视觉处理资源,保证视觉信息处理的效率,这就是视觉选择注意机制的原理。依据人类视觉选择注意的基本原理,开发能够进行智能图像信息处理的计算机系统,就成为一大任务。我们研究的主要方向是使计算机处理对象时,能够具备与人类相似的视觉选择注意能力。

2.视觉注意机制

研究视觉注意机制是个多学科交叉的问题,目前多个领域的研究人员都取得了研究成果,并且对视觉注意的理论都形成了一些共识。目前普遍认为注意既可以是按自底向上(自下而上)的图像数据驱动的,也可以是安自顶向下(自上而下)的任务驱动的。其中,自下而上的研究主要来自图像中物体数据本身的显著性。例如,在视觉搜索实验中,显著的物体会自动跳出,如图1中的圆点通过特征对比,以形状跳出的形式获得注意。自上而下的引导主要来自当前的视觉任务,以及场景的快速认证结果,即我们可以“故意”去注意任何一个“不起眼”的物体,如我们可以在图书馆浩如烟海的藏书中,找到自己感兴趣的那本书。

研究视觉注意机制的重要方法是研究眼睛在搜索目标时的表现。显著图中的各目标在竞争中吸引注意点,注意点在各个注意目标间转移。根据注意点转移时是否伴随眼动,视觉注意也分为隐式注意和显式注意。隐式注意的中央凹不会随着注意点的转移而移动,而显式注意的中央凹随每次注意点的转移而运动。

对视觉注意机制的研究为计算机视觉的发展提供了可能。计算机视觉借鉴人类视觉的注意机制,建立视觉注意的计算模型。通过“注意点”的选择与转移,实现对复杂场景中任务的搜索与定位,最终来实现实时信息的响应处理。在计算机视觉的研究中,显式注意应用较多。

3.计算机视觉注意模型

从人的角度来看,人类视觉系统通过视觉,选择注意在复杂的场景中迅速将注意力集中在少数几个显著的视觉对象上。从场景的角度来看,场景中的某些内容比其他内容更能引起观察者的注意,我们称之为视觉显著性,两者其实是从不同的角度对视觉选择注意过程的描述。

我们把引起注意的场景内容定义为注意焦点FOA(Focus of Attention)。Treisman的特征整合理论中将视觉信息处理过程划分为前注意和注意两个阶段,各种视觉特征在前注意阶段被以并行的方式提取出来,并在注意阶段以串行方式整合为视觉客体,即注意的特征和客体是通过不同方式进行的。在注意焦点的选择和转移上,Koch[2]进行了深入的研究,他提出注意焦点FOA的变化具有四个特征,即单焦点性:同一时刻只能存在一个FOA;缩放性:FOA的空间范围可以扩大或者缩小;焦点转移性:FOA能够由一个位置向另一个位置转移;邻近优先性:FOA转移时倾向于选择与当前注视内容接近的位置。同时注意焦点具有抑制返回的特点,即FOA转移时抑制返回最近被选择过的注视区域。在此基础上,视觉注意的研究人员提出了多种视觉注意模型。

4.视觉注意模型的研究现状

人类的视觉注意过程包括两个方面:一方面是对自下而上的初级视觉特征的加工,另一方面是由自上而下的任务的指导,两方面结合,共同完成了视觉的选择性注意。与此对应,当前的计算机视觉注意研究也分为这两个方面。

4.1自下向上的数据驱动注意模型研究及分析

在没有先验任务指导的情况下,视觉注意的目标选择主要是由场景中自下而上的数据驱动的,目标是否被关注,由它的显著性决定。现在,自下而上的注意研究主要基于Treisman的特征整合理论和Koch&Ullman的显著性模型,Itti、satoh等人均在此基础上提出了自己的研究模型,并做了一些模型的改进研究。自下而上的研究方法通过对输入图像提取颜色、朝向、亮度等方面的基本视觉特征的研究,形成各个特征对应的显著图。另外,一些研究者采用基于局部或全局对比度的方法,来得到图中每个像素的显著性,进而得到显著图。

现有的自下而上的视觉注意计算模型中,Itti的显著图模型(简称Itti模型)最具代表性。该模型主要包含3个模块:特征提取、显著图生成和注意焦点转移。模型通过初级特征的提取,将多种特征、多种尺度的视觉空间通过中央―周边算子得到的各个特征的显著性图合成一幅显著图。显著图中的各个目标通过胜者为王的竞争机制,选出唯一的注意目标,其中注意焦点的转移用的是禁止返回机制。但该模型也有一些缺点,如显著区与目标区域有偏差、计算量较大、运行时间较长、动态场景中实时处理不平等。

在动态场景之中,由于Itti模型很难满足实时性的要求,科研工作者们正在努力研究动态场景的特性,并建立相应的动态模型。如Wolfe[1]指出,影响前注意的特征包括颜色、方向、曲率、尺寸、运动、深度特征、微调支距、光泽、形状,等等,其中又以运动特征最为敏感。而You等采用了一种空间域特征和时间域特征相结合的视觉注意模型,该模型假设当场景中存在全局运动时,视觉注意对象将极少做运动。然而,许多真实的场景并不能满足这个假设,限制了模型的适用范围。Hang等人提出了一种运动图的计算方法,并把运动图作为特征之一,与颜色、亮度、方向等特征结合。这些研究关注了运动特征对视觉的影响,但是均存在一定的局限性,对于复杂的运动场景的注意焦点计算很难取得良好的效果。

我国研究者也在Itti注意模型的基础上研究了适合动态场景中的注意模型,形成了一些理论成果。如曾志宏[2]等人提出注意焦点计算模型,郑雅羽[3]等提出基于时空特征融合的视觉注意计算模型。这些模型都能较好地提取动态场景下的视觉目标。

4.2自上而下的任务驱动的注意模型研究及分析

自上而下的注意即任务驱动的注意,通过目标和任务的抽象知识,在一定程度上指导注意焦点的选择。在自上而下注意模型的研究方面,Laar(1997)提出了一个用于隐式视觉注意的模型,该模型通过任务学习,将注意集中于重要的特征。Rabak[4]提出了基于注意机制的视觉感知识别模型,该模型在定义目标显著性时,通过语义分析对其他三个自下向上的视觉控制参数项进行线性组合。Salah将可观测马尔科夫模型引入到模拟任务驱动的注意模型研究中,并在数字识别和人脸识别的实验中取得了很好的效果。Itti提出以调节心理阈值函数的形式来控制视觉感知。

目前对自下而上的数据驱动方面的研究较多,而对自下而上的任务驱动方面研究较少。因为任务驱动的注意与人的主观意识有关,同时受到场景的全局特征影响。自上而下的注意涉及记忆、控制等多个模块的分工协作,其过程非常复杂。

5.计算机视觉注意模型研究的趋势

自底向上和自顶向下的加工是两种方向不同的信息处理机制,两者的结合形成了统一的视知觉系统。人类的视觉信息处理系统只有遵循这样的方法,才能有效地实现视觉选择注意的目的。

实践证明,把自底向上和自顶向下的研究相分离的研究方法并不能很好地解决计算机的视觉注意过程。要想使计算机能够准确模拟人类的视觉注意过程,实现主动的视觉选择注意的目的,采用两种研究方法相结合的形式势在必行。自底向上的视觉注意计算往往离不开与自顶向下的有机结合,实现二者的优势互补是以后计算机视觉注意研究的一个趋势。

参考文献:

[1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.

[2]曾志宏,周昌乐,林坤辉,曲延云,陈嘉威.目标跟踪的视觉注意计算模型[J].计算机工程,2008,(23).

[3]郑雅羽,田翔,陈耀武.基于时空特征融合的视觉注意模型[J].吉林大学学报,2009,(11).

[4]Rabak I A,Gusakova V I,Golovan A V,et al.A model of attention-guided vision perception and recognition.Vision Research,1998,38.

第2篇:计算机视觉研究的目的范文

关键词:三目摄像机;标定;立体视觉;外部参数

一、绪论

1.1研究的背景及意义

计算机视觉是当今极为重要的学科之一,它在具有很强的挑战性的同时又拥有广泛的应用前景和实用价值。计算机视觉以视觉理论为中心,以图像处理、模式识别、计算机技术和生理学、心理学为基础,研究内容主要有两个方面:一是开发从输入图像数据自动构造场景描述的图像处理系统;二是理解人类视觉机理,用机器代替人去做人类难以达到或根本无法达到的工作[1]。

计算机视觉应用的广泛性体现在其不仅用于文字、指纹、面部、商标以及图像数据库、检测集成电路芯片、多媒体技术这些图像方面,还应用到机器人导航、工业检测和产品的自动装配、CT图像器官重建和遥感照片解释等空间物体的定位、识别以及重建上。现如今,计算机视觉已经应用到机器人、地理、医学、物理、化学、天文等各大的研究领域。

作为多个学科交叉与融合中心的计算机视觉,摄像机是其研究的重要工具,而摄像机标定又是计算机视觉研究的一个关键问题,故摄像机的标定越来越受到广泛的重视。摄像机标定是通过物体空间上的点与图像中的对应点的几何关系,来确定摄像机的内外参数的过程。标定结果是否准确影响着三维测量的精度和三维重建的结果,而且实时的标定更能满足自动导航机器视觉的需要[2]。

伴随着应用的发展,摄像机广泛地被应用于三维立体的测量、视觉检测、运动检测等领域。由此,对摄像机标定的精度要求也日益增加。摄像机标定结果的优劣影响了计算机视觉在各领域的应用。摄像机标定的准确与否,对能否提高计算机视觉在各领域测量的准确度有重要影响[3]。因此,研究摄像机标定方法具有重要的理论研究意义和实际应用价值。

1.2摄像机标定技术研究的发展及现状

摄像机有一个图像平面和提供三维空间到图像平面转换的镜头。由于镜头会产生畸变,不能把这个转化过程简单描述为投射变换。所以它表示的是畸变的模型,这些模型近似于真实数据,而其精确性则依靠于建立的模型及模型参数的准确性。

首先进行摄像机标定工作的是加拿大的Deville,他于1910年建立实验室,使用多个瞄准仪对他的“测量摄像机”(surveying camera)进行标定[4]。上个世纪三十年代后期,美国标准局发明了一种精确镜头,用来检测摄像机,同时将它用在摄像机标定上。四十年代后期,该项工作得到进一步加深,有了更多对高精度的需求和对易操作设备的需求。1955年,Carman出版了 《棋盘平面度的干涉测量和控制》,该书引起了社会各界对摄像机标定的关注。二战时期,随着飞机的大规模使用,航空摄影与制图兴起,为得到更加精确的测量结果,对摄像机镜头的校正要求也变得更高。五十到七十年代也是镜头校正技术发展最为迅速的时间段。在这期间,各种镜头像差的表达式逐步被提出并且得到普遍认同与采用,建立了很多的镜头像差的模型,D.C.Brown等人作出了比较大的贡献,他们导出了近焦距情况下给定位置处径向畸变表达式并证明了近焦距情况下测量出镜头两个位置的径向畸变就可以求出任何位置的径向畸变[5]。这些径向与切向像差表达式成为后来各摄像机的标定非线性模型的基础。这段时间里,研究的重点是如何校正镜头与用何种方法补偿镜头像差,这些研究对促进各性能镜头组的研制起到了重要作用。在1999年,张正友提出了一种简便的摄像机标定方法,该方法介于传统标定和自标定之间,操作方便灵活,能够得到不错的精度,满足了众多拥有桌面视觉系统的用户在摄像机标定方面的需求。

1.3本文的主要研究内容

本文的主要研究多个摄像机的标定问题。标定主要是对摄像机内外参的测量计算,利用这些参数对多个摄像机识别的物体尺寸进行衡量并建立起多摄像机系统的数字环境。

论文的内容包括:

第一章为绪论,介绍摄像机标定相关的研究背景、国内外研究现状。

第二章为摄像机标定理论基础:主要介绍标定的坐标系与待标定的参数。

第三章提出本文的多摄像机标定方法与实验过程。

第四章进行全文的总结。

二、摄像机标定方法研究

2.1摄像机标定原理

摄像机通过透镜将三维物体投影到--维图像平面上,这个成像变换的过程称为摄像机成像模型。摄像机成像模型有多种,最常用的为小孔成像模型。由于实际的摄像机镜头会发生一定的畸变,使得空间点所成的像不在线性模型描述的位置而会发生一定的偏移,为了能准确的标定摄像机参数,标定的过程中要考虑非线性畸变因子。

一般来说,得到标定结果后要对其精度进行评估,然而很难得到准确的摄像机标定参数真值作为参考,其中基于图像坐标和世界坐标的绝对和相对误差的评价方法应用广泛,本文将对这些方法的原理进行探讨。

2.2摄像机标定坐标系建立

首先定义了四个坐标系,如图1所示,图像坐标系的坐标原点为O0,列与行由坐标轴u和v表示;成像平面坐标系的原点是摄像机光轴与图像坐标系的交点0l,x、y 轴分别与u、v 轴平行;在摄像机坐标系中,坐标原点0c即为在摄像机的光心,Xc、Yc轴与x、y 轴平行,与图像平面垂直是摄像机光轴作为Zc轴,0c0l为摄像机焦距f;世界坐标系是假想的参考坐标系,可固定于场景中某物体上,用于描述摄像机的位置,由Xw,Yw,Zw轴组成。

图(1)

2.3摄像机外部参数构成

主动视觉传感器从在笛卡尔直角坐标系中的运动表现为相应的旋转矩阵和平移矩阵,故摄像机外部参数表现为旋转矩阵R和平移矩阵T,则摄像机坐标系与世界坐标系的转化关系可以表示成:

上式中(Xc,Yc,Zc)表示空间点在摄像机坐标系下的坐标,(Xw,Yw,Zw)表示空间点在世界坐标系下的坐标。根据靶标点在像空间坐标系和物方空间坐标系中的坐标,通过分解旋转矩阵线性计算像空间坐标系与物方空间坐标之间的转换参数,即外方位元素(摄站参数)[6]。

2.4各摄像机相对位置确定

三目摄像机拥有三个视觉传感器,而三个传感器之间的相对位置可通过已获得的外部参数进行确定。将三个摄像机坐标系设置为,Oci xci yci zci(i=1,2,3),由2.3中所介绍的内容可知,这三个摄像机坐标系与世界坐标系的关系为:

i=(1,2,3)

由此我们可以得到任意两个摄像机i,j的坐标系转换关系:

其中: = = i,j=1,2,3

三、摄像机标定实验过程及结果

3.1实验系统介绍

实验中被用来标定的是一个多摄像机系统,摄像机标定有关的基本参数、系统组成和开发环境如下:

(1)硬件环境

标定板、三目摄像机和图像采集卡等。

(2)软件环境

OpenCV开源视觉库,它仅由一系列C函数和少量C++类构成,为Python、MATLAB等语言提供了接口,在图像处理和计算机视觉方面实现了很多通用算法。

3.2实验过程

本系统以棋盘格模板作为标定模板。采用激光打印机打印棋盘格黑白方块间隔纸,方块边长为3cm,共6行9列,将打印纸固定在一块平板上,作为标定模板,如图(2)。安装三目摄像机系统,调节固定好个摄像机位置,如图(3)。手持标定板在三目摄像机前方各个位置拍摄5组共15张各姿态的照片,利用Canny算子进行像点灰度中心提取、同名像点匹配并解算出三个摄像机在标定板坐标系中的外部参数值。

3.3标定结果

摄像机1:

R= T=

摄像机2:

R= T=

摄像机3:

R= T=

四、总结

随着计算机技术的高速发展,计算机视觉成为当今热门的研究课题,受到了广泛关注。本文就如何在机器视觉的理论基础上对三目视觉系统进行标定进行了研究,讨论了计算机视觉理论知识,分析摄像机标定原理以及标定坐标系的建立。同时通过计算机视觉知识的分析讨论了基于三目视觉系统的摄像机标定技术,完成了三目视觉系统的外部参数标定实验。三目摄像机测量系统外部参数的标定能够解决测量作业现场、测量控制场建立难的问题,为快速地建立简单实用的控制场提供了方案,有一定的实用价值。

参考文献

[1] 荆丽秋.双目视觉系统标定与匹配的研究与实现[D].哈尔滨工程大学,2009.DOI:10.7666/d.y1489086.

[2] 马颂德.计算机视觉―计算理论与算法基础[M].北京:科学出版社,1998.

[3] 王荣一.摄像机标定及关键技术研究[D].哈尔滨理工大学,2011.DOI:10.7666/d.y2012483.

[4] Clarke T A,Fryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66

[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.

[6] 范亚兵,黄桂平,高宝华等.三目立体工业摄影测量系统外部参数的快速标定[J].测绘工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013

第3篇:计算机视觉研究的目的范文

关键词:计算机视觉技术;食品工业;分级;图像处理

中图分类号: TS207 文献标识码:A

随着微型个人计算机应用的越来越广泛,以及计算机在综合学科中应用的深入研究,现如今在工农业、军事国防、医学卫生等众多领域的使用和研究方面计算机视觉技术都起到了至关重要的作用,为了节省人力、降低成本、减少误差,该项技术在食品企业、科研院所、检测机构中的应用更加普遍。如今,在农产品药物残留检测、水果重量分级、等级筛选、质量监管等方面计算机视觉技术有众多应用。

1 计算机视觉技术概述

计算机视觉技术是利用计算机、摄像机、图像卡以及相关处理技术来模拟人的视觉,用以识别、感知和认识我们生活的世界[1]。该技术是模拟识别人工智能、心理物理学、图像处理、计算机科学及神经生物学等多领域的综合学科。计算机视觉技术用摄像机模拟人眼,用计算机模拟大脑,用计算机程序和算法来模拟人对事物的认识和思考,替代人类完成程序为其设定的工作。该技术由多个相关的图像处理系统组成,主要包括光源提供系统、图像提取系统、计算机数据运算系统等。原理是:首先通过摄像机获得所需要的图像信息,然后利用信号转换将获得的图像信息转变为数字图像以便计算机正确识别[2]。随着科学技术的发展,计算机技术在各个领域得到广泛应用,计算机视觉技术不仅在代替人类视觉上取得了重大成就,而且在很多具体工作方便超越了人的视觉功能。计算机视觉计算有如此快速的发展,是因为与人类的视觉相比该技术具有以下显著优势[3]。

1.1 自动化程度高

计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。

1.2 实现无损检测

由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。

1.3 稳定的检测精度

设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。

2 计算机视觉技术在食品检测中的应用

20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚多达20a,但是发展很快。

2.1 计算机视觉技术在果蔬分级中的应用研究

计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图像处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco. J [15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。王江枫等[17]建立了芒果重量与摄影图像的相互关系,应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤,按重量分级其准确率均为92%,按果面损伤分级的准确率分别为76%和80%。

2.2 计算机视觉技术在禽蛋检测中的应用研究

禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和BET算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。Mertens K等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。

2.3 计算机视觉技术在检测食品中微生物含量中的应用研究

计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar. B等[26]人采用计算机视觉技术、光散射技术(BARDOT)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征,识别出微生物数量,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。

2.4计算机视觉技术在其他食品产业中的应用研究

里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。Gokmen,V等通用对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率也关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。

3 展望

新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。

3.1 检测指标有限

计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大。例如,Davenel等通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花粤和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。Nozer等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。

3.2 兼容性差

计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是同一套系统和设备很难用于其他种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。Majumdar.S等利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。

3.3 检测性能受环境制约

现阶段的计算机视觉技术和配套的数学模型适用于简单的环境,在复杂环境下工作时会产生较大的误差。Plebe等利用计算机视觉技术对果树上的水果进行识别定位,但研究发现由于光照条件以及周边环境的影响,水果的识别和定位精度不高,不能满足实际生产的需要。

综上所述,可看出国内外学者对计算机视觉技术在食品工业中的应用进行了大量的研究,有些研究从单一方面入手,有些研究综合了多个学科,在研究和应用的过程中,取得了较大的经济效益,也遇到了很多问题,在新的形势下,计算机视觉技术和数码拍摄、图像处理、人工神经网络,数学模型建设、微生物快速计量等高新技术相融合的综合技术逐渐成为了各个领域学者的研究热点,以计算机视觉为基础的综合技术也将在食品工业中发挥更加重要的作用。

参考文献

[1] 宁纪锋,龙满生,何东健.农业领域中的计算机视觉研究[J].计算机与农业,2001(01):1-3.

[2] 李峥.基于计算机视觉的蔬菜颜色检测系统研究[D].吉林:吉林大学,2004.

[3] 曾爱群.基于计算机视觉与神经网络的芒果等级分类研究[D].桂林:桂林工学院,2008.

[4] 韩伟,曾庆山.基于计算机视觉的水果直径检测方法的研究[J].中国农机化,2011(05):25-29.

[5] 李庆中.苹果自动分级中计算机视觉信息快速获取与处理技术的研究[D].北京:中国农业大学,2000.

[6] 孙洪胜,李宇鹏,王成,等.基于计算机视觉的苹果在线高效检测与分级系统[J].仪表技术与传感器,2011(06):62-65.

[7] 刘禾,汀慰华.水果果形判别人工神经网络专家系统的研究[J].农业工程学报,1996,12(0l):171-176.

[8] 应义斌,景寒松,马俊福.用计算机视觉进行黄花梨果梗识别的新方法[J].农业工程学报,1998,14(02):221-225.

[9] 杨秀坤,陈晓光,马成林,等.用遗传神经网络方法进行苹果颜色白动检测的研究[J].农业工程学报,1997,13(02):193-176.

[10] 陈育彦,屠康,柴丽月,等.基于激光图像分析的苹果表面损伤和内部腐烂检测[J].农业机械学报,2009,40(07):133-137.

[11] 冯斌,汪憋华.基于计算机视觉的水果大小检测方法[J].农业机械学报,2003,34(01):73-75.

[12] 朱伟,曹其新.基于模糊彩色聚类方法的西红柿缺陷分割[J].农业工程学报,2003,19(03):133-136.

[13] 曹乐平,温芝元,沈陆明.基于色调分形维数的柑橘糖度和有效酸度检测[J].农业机械学报,2009,41(03):143-148.

[14] 刘刚,王立香,柳兆君.基于计算机视觉的苹果质量检测[J].安徽农业科学,2012,40(08):5014-5016.

[15] Blasco J,Aleixos N,Molto puter vision detection of peel defects in citrus by means of a region oriented segmentation algorithm[J].Journal of Food Engineering,2007,81(03):535-543.

[16] 赵广华,飞,陆奎荣,等.智能化苹果品质实时分选系统[J].中国科技信息.

[17] 王江枫,罗锡文,洪添胜,等.计算机视觉技术在芒果重量及果面坏损检测中的应用[J].农业工程学报,1998(12):186-189.

[18] 欧阳静怡,刘木华.基于计算机视觉的鸡蛋裂纹检测方法研究[J].农机化研究,2012(03):91-93.

[19] 汪俊德,郑丽敏,徐桂云,等.基于计算机视觉技术的双黄鸡蛋检测系统研究[J].农机化研究,2012(09):195-199.

[20] 郑丽敏,杨旭,徐桂云,等.基于计算机视觉的鸡蛋新鲜度无损检测[J].农业工程学报,2009,25(03):335-339.

[21] 潘磊庆,屠康,詹歌,等.基于计算机视觉和声学响应信息融合的鸡蛋裂纹检测[J].农业工程学报,2010,26(11):332-337.

[22] Mertens K,De Ketelaere B,Kamers B,et al.Dirt detection on brown eggs by means of colorcomputer vision[J]. Poultry Science,2005,84(10):1653-1659.

[23] 殷涌光,丁筠.基于计算机视觉的食品中大肠杆菌快速定量检测[J].吉林大学学报(工学版),2009,39(02):344-348.

[24] Lawless C,Wilkinson DJ,Young A,et al.Colonyzer: automated quantification of micro-organism growth characteristics on solid agar[J].BMC Bioinformatics,2010(08):38-44.

[25] 郭培源,毕松,袁芳.猪肉新鲜度智能检测分级系统研究[J].食品科学,2010,31(15):68-72.

[26] Bayraktar B,Banada PP,Hirleman ED,et al.Feature extraction from light-scatter patterns of Listeria colonies for identification and classification [J].Journal of Biomedical Optics,2006,11(03):34- 36.

[27] 殷涌光,丁筠.基于计算机视觉的蔬菜中活菌总数的快速检测[J].农业工程学报,2009,25(07):249-254.

[28] 鲁静.乳品微生物自动检测系统的设计[J].湖北第二师范学院学报,2010,27(08):115-117.

[29] 刘侃.鲜奶含菌量快速检测系统[D].华中科技大学,2008.

[30] 里红杰,陶学恒,于晓强.计算机视觉技术在海产品质量评估中的应用[J].食品与机械,2012,28(04):154-156.

第4篇:计算机视觉研究的目的范文

关键词:双目视觉;三维可视化;信息融合

1.引言

随着计算机软、硬件突飞猛进的发展,社会的各行各业对三维可视化技术的需求已经越来越突出。当前三维显示技术已在军事、航空、航天、医学、地质勘探、文化娱乐和艺术造型等方面得到广泛应用。

为实现变电站的三维可视化,需要对变电站进行三维建模,构建变电站的三维模型。监控摄像头采集现场数据之后,对视频进行智能处理,根据设备的状态和人员目标的状态,将设备与人员的状态融合入变电站的三维可视化系统中,通过采集的数据以及处理结果实时更新目标的状态和位置,并且实时显示到变电站三维系统中。

2.三维可视化技术研究现状

(1)研究现状

1)建模软件

目前应用较多的是欧特克(Autodesk) 公司的 3ds MAX 和Maya;Multigen 公司的 Creator;Google 公司的 Sketch Up;Microsoft旗下Caligari公司的trueSpace等。这些建模软件,几乎可以满足我们所见到的任何现实世界中的物体模型的建立,比如房屋、道路、管道、植物、动物、日常用品以及我们现实生活中见到的一切。

2)平台软件和应用软件

三维可视化软件大都依赖于计算机图形学和可视化技术的发展。人们对计算机可视化技术的研究已经历了一个很长的历程,而且形成了许多可视化工具,比如 Directx 和 OpenGL,尤其在地里信息系统领域,当前Arc/info,MapInfo,MAPGIS,SuperMap,GeoStar等国内外专业二维 GIS 软件都有自己专有的三维GIS 子系统。比较专业的三维可视化系统软件或平台有:美国 ERDAS 公司的 IMAGINE Virtual GIS;美国 Skyline 软件;国内适普软件有限公司的 IMAGIS Classic;国内灵图的VRMap。

另外,像国内的武汉吉奥公司的CCGIS、上海杰图三维展示系统、中视典的 VRP 产品体系,在三维可视化方面都有自己独特的功能。

(2)双目立体视觉与三维重建

双目立体视觉是计算机视觉的基础内容,它利用成像设备在不同角度获取目标物体的两幅图像,然后基于视差原理,计算两幅图像中对应点的位置偏差,获取物体空间信息的方法。

3.信息融合技术发展状况及方法

(1)发展状况

信息融合技术是智能信息处理的一个重要研究领域。1973年,美国国防部自主开发了声呐信号理解系统,数据融合技术在该系统中得到最早的体现。此后,数据融合技术蓬勃发展,不仅在人工系统中尽可能采用多种传感器来收集信息,而且在工业控制和管理等领域也朝着多传感器方向发展。20世纪70年代末,在公开的技术文献中开始出现基于多传感器信息整合意义的融合一词,并开始广泛应用与军事与民用领域。

在美国军用电子技术带动下,20世纪80年代后期以来西方其他先进技术国家也先后加强多传感器信息融合研究活动,而且很快向民用部门扩展。1987年2月,美国国家科学基金会(NSF)首次在犹他州召开了“制造自动化中的多传感器信息融合”学术研讨会。

同年10月,全美人工智能学会(AAL)在伊利诺斯州召开了“空间推进与多传感器融合”学术研讨会。1988年,美国摄影仪器工程师协会(SPIE)主办了两次有关信息融合的学术研讨会,一次主题为“空间推理与景物解释”,另一次主题为“传感器融合”。同年,美国国防部把信息融合技术列为90年代重点研究开发的二十项关进技术之一,且列为最优先发展的A类。1989年,北约组织也在巴黎召开了这方面的会议,主题是“计算机视觉中的多传感器融合”。美国一实验室理事会(JDL)下设的C3技术委员会(TPC3)专门成立了信息融合学术会议,并通过SPIE传感器融合专辑、IEEE Trans,On AES,AC等发表有关论著;为了进行广泛的国际交流,1998年成立了国际信息融合学会,总部设在美国,每年举行一次信息融合研究国际学术大会。

到目前为止,美、英、法、意、日等国已研究出上百个军用融合系统,取得了一定的成果,但还存在着一些难题没有完全解决。如传感器模型、融合过程的推理以及有关算法的研究等。

国内关于信息融合技术的研究起步相对较晚,到了20世纪80年代末才开始有关多传感器信息融合技术研究的报道。20世纪90年代初,这一领域在国内才逐渐形成高潮。在政府、军方和各种基金部门的资助下,国内一批高校和研究所开始广泛从事这一技术的研究工作,出现了一大批理论研究成果。

20世纪90年代中期以来,信息融合技术在国内已发展成为多方关注的共性关键技术,出现了许多热门研究方向,许多学者致力于机动目标跟踪、分布监控融合、多传感器综合跟踪与定位、分布信息融合、目标识别与决策信息融合、姿态评价与威胁估计、图像融合、智能机器人等领域的理论及应用研究,相继出现了一批多目标跟踪系统和有初步综合能力的多传感器信息融合系统。

(2)信息融合技术方法

信息融合作为对多源信息的综合处理过程,具有本质的复杂性。传统的估计理论和识别算法,以及新兴的基于统计推断、人工智能和信息论的新方法,都可以用来解决信息融合问题。目前主要的信息融合方法可以分为以下几类:

1)信号处理与估计理论方法

这种方法包括小波变换技术、加权平均、最小二乘、卡尔曼滤波等线性估计技术,以及扩展卡尔曼滤波(EKF)、高斯和滤波(GSF)等非线性估计技术,以及近年来发展的 UKF滤波、粒子滤波和马尔科夫链蒙特卡洛(Markov Chain Monte Carlo, MCMC)等非线性估计技术。

2)统计推断方法

统计推断方法包括经典推理、贝叶斯推理、证据推理、随机集(random set)理论以及支持向量机理论等

3)信息论方法

信息论方法运用优化信息度量的手段融合多源数据。典型算法有熵方法、最小描述长度方法(MDL)等。

4)决策论方法

决策论方法往往应用与高级别的决策融合。

5)人工智能方法

人工智能方法包括模糊逻辑、神经网络、遗传算法、基于规则的推理,以及专家系统、逻辑模板法和品质因数法等。

6)几何方法

几何方法通过充分探讨环境以及传感器模型的几何属性来达到多传感器信息融合的目的。

4.总结

随着新技术的不断发展,未来还会应用到更多更新的领域中,本文对三维可视化技术和信息融合技术的研究现状及原理进行了分析,相信基于信息融合的三维可视化技术未来也将在电网建设中进一步深化应用。

参考文献

[1]郭玲. 智能视频监控中运动目标检测的算法研究[D]. 华南理工大学,2013.

[2]孙振宇. 双目视觉重构算法及其在变压器中的应用[D]. 东北电力大学,2015.

[3]余小欢,韩波,张宇等. 基于双目视觉的微型无人机室内3维地图构建[J]. 信息与控制,2014,43(4):392-397.

[4]常文凯,李恩,杨国栋等. 基于双目视觉的输电线路近距离三维位置测量[J]. 华中科技大学学报,2015,43:144-147.

第5篇:计算机视觉研究的目的范文

【关键词】计算机;视觉系统;框架构思

在现代计算机技术的支持下,对人类视觉功能进行模拟的计算机系统被称为计算机视觉系统,因为视觉系统本身兼具科学性和应用性,所以计算机视觉系统本身既具有科学学科的特性又具有工程学科的特性。对其的研究不仅能够进一步了解人类本身,而且能够在工业生产领域发挥更大的作用。

1 计算机视觉系统现有理论框架

1.1 计算机世界理论框架

20世纪80年代,麻省理工学院教授Marr在视觉理论研究领域获得突破,提出了利用计算机实现视觉能力的理论框架――计算机视觉理论,这一理论主要特点是以现代信息处理的方式对人类视觉能力作用机制进行了分析,并以人类的视觉能力为基础在计算机技术的支持下形成了三个不同的计算机层次。分别是计算机理论层次、表示层次和算法层次。这三个层次分别对应着人类对视觉信息进行处理的三个环节,通过各个环节的仿生设置,计算机视觉系统就能够将初步的视觉处理能力赋予计算机。这一理论中的核心是计算机理论层次,Marr认为人类的视觉能力主要是从图像中建立物体形状和位置的描述,所以在这一层次中设计者设计的主要环节是从初步获取的二维图像中提取和细化物体的三维结构和位置,并将这些信息在一个二维平面上反映出来,即三维重建。

1.2 基于知识的视觉理论框架

基于知识的视觉理论框架最早产生于20世纪90年代,最早的提出者是Lowe。认为在人类的视觉能力发挥过程中,对三维物体的实际测算是不必要的,人类的视觉能力与三维测算能力没有直接的关系,虽然使用三维测算技术也能够实现计算机视觉系统的功能,但并不是对人类视觉功能的模仿。Lowe认为在人类的视觉活动中,会将三维物体看成二维物体,也会将二维物体看成三维物体。这种现象本身并不是偶然性的,而是一种视觉作用机制的必然。既然人类肉眼能够借助一定的作用机制和处理能力实现二维的三维化,在计算机视觉系统中就完全有可能设计出这种对人类肉眼直接模拟的机制。以感知系统感知物体的二维特性,并在其基础上直接生成三维图像,而不需要借助复杂的测量过程。

1.3 主动视觉理论框架

主动视觉理论是在现有计算机理论的基础上形成的新型理论框架,是根据人类视觉功能实现的主动性提出的。在人类实现视觉功能的过程中,人类的视觉系统并不是被动的,而是会根据视觉系统的要求调动身体的其他部位进行配合的、具有主动性的,所以在人类视觉功能的发挥过程中,视觉系统是具有主动性的,人类视觉系统的视角、关注点都会是动态变化的。

基于这一理论,主动视觉理论框架认为人类的视觉活动是一种“感知――动作”过程。根据这一原则,主动视觉理论框架认为计算机视觉系统并不需要精准的三维测算系统。而应该以计算机视觉获取系统为核心,设置主动的视觉系统。这一理念在实际的应用中主要通过对图像获取系统技术参数的调整和控制来实现,例如摄像机的位置、取向、焦距、光圈等,通过对这些参数的调整图像信息获取系统就能够从不同的视角对物体进行观察,进而获取物体的三维图像信息。

2 计算机视觉理论框架中存在的问题

计算机视觉理论框架的产生极大的支持了计算机视觉系统的研发工作,但是在计算机视觉系统的实际研发工作中,也逐渐暴露出了计算机理论框架的缺陷。当前主流的计算机视觉系统框架中,计算机视觉理论是最早产生的也是唯一一种被动的计算机视觉技术。在其理论系统中更多的强调人类视觉系统的测算能力,而没有意识到人类的视觉系统是一种主观性很强的、目的性很强的信息获取系统,完全建立在测算基础上的计算机视觉理论框架是不必要的。

基于知识的理论框架,认为人类视觉系统的功能实现主要环节是反馈,强调了人类视觉活动中主观意识的指导作用。但是它过于强调系统的目的性和主观性,完全否定了计算机视觉理论,认为人类视觉系统是个完全脱离计算机的认识过程,这种认识显然是错误的,在判断物体尺寸大小、距离远近时,测算无疑是极为必然的。

主动视觉理论并不完全排除三维重建,认为计算机视觉系统的三维重建应该建立在图像获取系统的主动性上。通过改变图像获取摄像机的角度、参数对时间、空间和分辨率等进行有选择的感知,解决了计算机视觉系统认知过程中的不稳定问题,降低了计算机视觉系统实现的难度。但是在其理论框架内部缺乏主观、高层的指导,从整体上看并不完善。

3 计算机视觉系统框架的新构思

在计算机视觉系统的研究领域,三种理论构建各有优劣。但是无疑反应了当前计算机视觉系统研发的主流思想,因此计算机视觉系统框架的新构思应该在其基础上进行,致力于克服各个理论的缺点。综合比较三种理论框架,笔者认为计算机视觉理论虽然存在某些问题,但是从整体上看这一理论框架是最具实践性和操作性的,其存在的问题完全可以借助其他理论框架加以解决,因此笔者以计算机视觉理论为主体,结合基于知识的视觉理论和主动视觉理论,提出一个更加完善和通用的计算机视觉系统构架。

计算机视觉系统视觉功能实现的主体结构还是建立在计算理论结构的基础上的,将计算理论框架中的早期视觉处理环节分为图像预处理、图像分割和二维模式识别两个部分,因为图像的预处理是在平面图像基础上的简单处理,不需要主观主导意识和目的性的参与,同时图像分割和二维模式识别能够最大限度的提升后继图像处理的效果。

在早期处理完成以后,后继的中后期处理还是分别情调了二维模式识别和三维模式识别,虽然这两种模式本身的识别原理是一样的,但是其面对的对象不同,物体的模型也不同。一般来讲,在我们的世界中二维信息具有很强的重要性,图形、文字、指纹等关键二维信息在通常情况下作用更大、应用范围更广,所以计算机视觉系统矿建的新思路中,要对二维信息进行进一步的处理。

模型库提供具体物体模型的表示。知识库不但要对物体进行抽象表示而且还要对抽象知识进行推理。人类经验的积累和知识的获取是通过学习而得到的,所以加人模型库、知识库管理,并让其从输出结果中进行学习。这将使模型库和知识库更加丰富和完善。

视觉活动本身是带有目的性的,所以在有些时候视觉系统的应用确实需要视物体的实际情况来决定,有时只需识别场景中存在的是什么物体或某物是否存在,而不要求定量恢复场景中的物体。因此,在计算机视觉系统中引人视觉目的来判断输出是否满足要求。同时,用视觉目的对图象分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别加以控制。如果需要三维重建则由主动视觉控制成象来获得景物更完整的信息。

计算机视觉系统框架是支持计算机视觉系统实现的重要基础,所以在计算机视觉系统的研发、设计工作中,对理论框架的研究具有鲜明的现实意义,本文简单介绍了现有框架思想,并分析了其各自的优缺点,最后再这些理论框架的基础上形成了计算机视觉系统框架的新构思。认为计算机视觉系统构架应该以计算机理论为基础,以视觉活动的主观性和目的性为指导,以具体的视觉实现形式为方法。

【参考文献】

第6篇:计算机视觉研究的目的范文

关键词 智能交通系统;计算机视觉;汽车流量

中图分类号:TN948 文献标识码:A 文章编号:1671-7597(2014)14-0048-01

基于视觉的图像处理器测量精度高,抗干扰能力强,许多自然及人为的干扰都可以被消除,运用预测技术可以再捕获瞬间丢失的目标,并且能实现对记忆的跟踪。它通常安装在路边或架空安装,不会重新铺设路面,也不会影响埋在地下的水和天然气管道,更不会干扰交通。 基于视觉的图像处理有其突出的优点,表现在:可以获得的目标信息非常巨大,获取信息的方法也非常方便。

1 研究的实用意义

车辆检测系统在智能交通系统中具有很重要的地位。机动车辆流量计数与监控为智能控制提供了相当重要的数据来源,通过计算机视觉的机动车流量统计系统可以检测很多交通参数,便于我们检测和监控,这些参数中的一个重要参数就是汽车

流量。

基于视频的检测法作为最有前途的方法之一,有以下优点。

1)能高效、准确、安全可靠地的监视和控制道路交通,能够提供高质量高分辨率的图像信息。

2)用于交通监视和控制的主要设备就是安装视频摄像机,现在我国所有城市基本都已经安装了视频摄像机,甚至高清视频摄像机。因为安装视频摄像机破坏性非常低、很方便、也很经济。

3)由计算机视觉得到的交通信息可以通过联网工作,非常有利于对道路交通网的监视以及控制。

4)由于目前对智能交通系统的安全性、实时性和可靠性的要求都非常高,计算机技术和图像处理技术的发展显得极其

重要。

2 研究内容

本研究主要包含两大部份:一部分就是采用分类和分割方法把采集到的视频图像的目标进行识别;另一部分就是通过定位方法来实现目标的跟踪。这两部份是缺一不可,紧密联系在一起的。

首先先介绍视频图像的目标识别,视频图像目标的识别方法有很多,但总体上主要有两种方法:一是大家熟悉的相关匹配法,二是特征匹配法。相关匹配法是通过找到最大相关值(最大相关值指的就是当前图像与参考图像间的相关系数的大小)所在的位置来确定当前输入图像中的目标位置。相关匹配法优点是可以在信噪比很小的条件下工作,对噪声抑制能力非常强,在计算形式上比较简单,很容易实现。但它的缺点也很明显,由于相关匹配法对几何和灰度畸变十分敏感,反而计算量偏大,造成的直接后果就是非常容易产生累积误差,而且最关键的就是不能充分利用视频图像目标的几何特性,就不能保证对识别目标的跟踪精度。相关匹配法比较适合于对目标的尺寸变化不大并且场景各部分的相关性不强,当前输入图像和参考图像的产生条件较为一致的场合。特征匹配方法是目前研究较多的一类图像匹配方法,它是通过目标的特征与输入图像中目标的特征来比较辨识目标。它首先提取输入图像和参考图像的相关特征信息,比如边缘、角点等。然后通过测量距离来比较输入图像与参考图像的特征集合,如果输入图像的特征集与参考图像的特征集距离是最小的(在满足给定约束条件下),则判定该目标被识别。它对目标的几何特征、灰度畸变一点都不敏感,但它充分利用了目标图像的特征信息,因而可以保证较高的跟踪精度。

上面介绍了视频图像目标的识别,现在介绍本研究第二部分:通过定位方法来实现目标的跟踪。对于图像目标的跟踪方法通常有下面几个方法。

亮度中心法,其实这种方法计算很简单,只要确定了一个点,就能完成定位。这个点就是一个跟踪点,它就是具有最高灰度的像素点(来自获得的视频目标图像)或这个点上的一个邻域。这种方法、性能很稳定、容易实现,工程上运用的很多。但这种跟踪非常容易受干扰,因为它主要适用于红外和其他放射性目标的跟踪。

最佳空间滤波法是常用跟踪方法之一,它完全是在亮度中心法的基础上建立起来的,为了提高跟踪性能,就要把目标的大小、形状、运动特性等特征都完全利用起来。但目前这类方法也有明显缺点,在实用性、定位精度上和计算量方面都有较大的限制。

投影、形心法是通过目标的投影或形心来确定目标的实际位置和运动姿态。对比前面两种跟踪方法,投影、形心法的优点是计算量非常小,容易通过硬件方式来实现。缺点是它的抗干扰性能力比较差,主要用于均匀背景下跟踪孤立目标。

从以上对研究内容的介绍,现有的各类识别和定位方法都各有优缺点,要想找到一个合适的方法,都达不到满意的效果。要想取得较好的性能,都只能在目标尺寸相对对比度变化都不大、对噪声的干扰又比较小、图像灰度的空间变化并不明显的理论环境中。然而实际的环境通常是变化无常的,通过一种方法来实现目标的识别与跟踪很难有合适的效果。最近几年,结合这些方法的优点和缺点,混合定位识别的方法确能将上述各类基本的识别方法进行混合定位,使它们能够合二为一,相互补充。这代表着目标识别方法非常具有理论研究和应用价值,是一个重要发展方向。

3 技术路线

研究的技术路线(如图1):首先提取出摄像机采集到的视频,该视频是以帧为单位的图片文件形式。然后对图像数据进行数学上的处理,比如二值化、提取边缘等。这样就可以识别汽车的位置进行定位,最后对识别出来的汽车数量通过计数器计数。

4 研究实现

通过基于计算机视觉的研究,我们设计出了能够实现机动车流量的检测和计数的系统。并且该系统能够对运动目标进行识别与跟踪定位,对出现多目标遮挡和丢失目标,还可以重新匹配。

5 结束语

本文创新之处就是将上述各类基本的识别方法进行混合定位,使它们能够相互补充。这代表着目标识别方法非常具有理论研究和应用价值,是一个重要发展方向。

参考文献

[1]章毓晋.图像工程(第2版)[M].清华大学出版社,2007.

[2]夏文龙.基于计算机视觉的汽车流量检测研究[D].四川大学,2003.

[3]葛群辉,浅谈基于视觉的高速公路车流检测技术[J].科技资讯,2010(2).

[4]刘萌萌,基于无标度摄像机的车流跟踪与速度估计算法研究[D].西南交通大学,2005.

第7篇:计算机视觉研究的目的范文

【关键词】VR技术;虚拟现实技术

1.虚拟现实技术的概念

VR技术就是虚拟现实技术,它是一种能够让现实中的人在计算机所创造的虚拟信息世界中体验与现实世界同样的事和物。它所具有多感知性、沉浸性、交互性和构想性的基本特征。这种虚拟技术集合了计算机图形图像技术、现实仿真技术、多媒体技术等等的多种科学技术。它能够模拟出人的视觉,听觉,触觉等的感官功能。使人在计算机所创造的虚拟世界中通过语言、动作等等的方式进行实时交流,可以说这种技术的发展前景是非常的广阔的。

2.虚拟现实技术的特征介绍

①多感知性的特征,是指视、力、触、运动、味、嗅等感知系统,从人类理想的虚拟现实技术的发展来说,是希望能够给完全的模拟出现实中所有的感知,但因目前的技术掌握和传感技术的限制,仅仅只能模拟出以上视、力、触、运动、味、嗅等感知系统的。

②沉浸性又称浸没感或临场感,存在感等,具体是指人以第一人称存在在虚拟世界中的真实体验。当然,以目前技术还没有达到最理想的程度。

③交互性就是指人在虚拟世界中,能够像在现实当中一样,可以通过对一些物体的抓取、使用等动作,感觉到所触碰的物体的重量,形状,色泽等一些人与物体之间的互动信息。

④构想性,即在虚拟的世界里面,将所想的物件所做的事情在虚拟世界呈现出来,这样做能达到什么样的效果,那样做又能达到什么样的效果,甚至还可以把在现实世界不可能存在的事和物都可以在虚拟世界中构想出来。

3. VR技术的应用范围

VR技术由诞生到现今已经历了几个年代,其应用范围也越来越广,如医学方面,可以提供给医生进行模拟手术,这样大大提供了现实中手术的成功几率,还有军事,科技,商业,建筑,娱乐,生活等等。

4. VR技术中涉及的相关技术

①立体视觉现实技术:人通过视觉所获取到的信息是人本身所有感觉中最多的一种感官,所以虚拟现实技术中立体显示技术占有不可或缺的重要地位。

②环境构建技术:在虚拟世界中,构件环境是一个重要的环节,要营造一个区域的环境,首先就要创造环境或建筑模块,然后在这个基础上再进行实时描绘、立体显示,从而形成一个虚拟的区域环境。

③真实感实时描绘技术:要在虚拟世界中实现与现实世界相同的事物,仅靠立体显示技术还是远远不够的,虚拟世界中必须存在真实感和实时感,简单来说就是实现一个物体的重量,质量,色泽,相对位置,遮挡关系等的技术。

④虚拟世界声音的实现技术:在虚拟世界中虽然视觉是获取信息的重要途径之一,除了视觉还有很多感官系统可以获取到周围的信息。如听觉,这种技术就是在虚拟世界中实现声音,这样人在虚拟世界里不仅能够看得到也能听得到。

5. VR技术中所涉及的硬件设备

①输入设备

与虚拟现实技术相关的硬件输入设备分成两大类:一是基于自然的交互设备,用于虚拟世界的信息输入;另一种是三维定位跟踪设备,主要用于输入设备在虚拟世界中的位置进行判定,并输送到虚拟世界当中。

虚拟世界与人实现自然交互的形式有很多,例如有数据手套,数据衣服,三维控制器,三维扫描仪等。

数据手套是一种多模式的虚拟现实硬件,通过软件编程,可进行虚拟场景中物体的抓取、移动、旋转等动作,也可以利用它的多模式性,用作一种控制场景漫游的工具。数据手套的出现,为虚拟现实系统提供了一种全新的交互手段,目前的产品已经能够检测手指的弯曲,并利用磁定位传感器来精确地定位出手在三维空间中的位置。这种结合手指弯曲度测试和空间定位测试的数据手套被称为“真实手套”,可以为用户提供一种非常真实自然的三维交互手段。

数据衣是为了让VR系统识别全身运动而设计的输入装置。数据衣对人体大约50多个不同的关节进行测量,包括膝盖、手臂、躯干和脚。通过光电转换,身体的运动信息被计算机识别。通过BOOM显示器和数据手套与虚拟现实交互数据衣。

②输出设备

人在虚拟世界中要体现沉浸的感觉,就必须实现现实世界中的多种感受,如是视、听、触、力、嗅、味等感官感觉,只不过以目前的虚拟技术只实现了视觉,听觉和触觉罢了。

③VR构成设备

虚拟现实世界的构成,主要的设备就是计算机本身了,虚拟世界的所有景象都是靠一个个模型造成的,而这些模型则是由计算机制作出来的。一般计算机被划分成四个部分,第一:高配置的个人计算机,专门用于普通的图形配置加速卡,实现于VR技术中的桌面式特征;第二:高性能图形工作站,就是一台高配置的图形处理计算机;第三:高度并行系统计算机;第四:分布式虚拟实现计算机等四个分类。

6. VR技术上的难点探讨

随着计算机的不断发展,人与计算机的互动性得到了非常好的提现。而这种技术则成为了VR技术建立的主要手段。但是实时现实始终一直阻挡这VR技术前进的一大难点之一,即时在理论上能够分析得到高度逼真、实时漫游的虚拟世界,但至少以目前的状况来说还达不到理论上的要求。这种理论性的技术是需要强大的硬件配置要求支撑的,比如说速度极快的图形工作计算机和三维图形加速卡等等设备,但以目前的设备来看即时最快的图形处理计算机也不能达到十分逼真的同事又是实时互动的虚拟世界。根本的原因就在于,因为引入了人与虚拟世界的互动,需要即时生成新的动态模型时,就不能达到实时的效果了,所以就不得不降低图形模块的清晰度来减少处理的时间,这样直接导致了虚拟世界的逼真在某程度上的减少,这就是所谓的景物复杂度的问题了。

图形模块的生成是虚拟世界中的重要瓶颈,虚拟世界的重要特性随着人的位置、方向的不断变更状态下感受虚拟世界的动态特性,简单来说,就是你移动一下位置和方向后所看到的即时生成的图形模块景象。有两种指标可以衡量用户沉浸在虚拟世界中的效果和程度。其一就是之前所说的动态特性;其二就是互动的延迟特性。自然动态图形的形成的帧数是30帧,至少也不能低于10帧,否则整体画面就会出现严重的不连续和调动的感觉。互动延迟是影响用户的另一个重要指标,如人在飞机上飞行时,位置的变换和方向的控制,这时系统应当即时产生相对的图形画面,期间的时间延迟应不大于0.1秒,最多也不能大于1/4秒。否则在长期的工作中,人会容易产生疲劳、烦躁或者恶心的感觉,严重地影响了“真实”的感觉。以上两种指标都以来计算机图形处理的速度。对于动态的模块图形生成而言,每帧的图形生成时间在30~50毫秒之间为较好;而对于互动性的延迟,除互动式输入及其处理时间外,其图形的生成速度也是重要的因素。而以上所叙述的因素都与图形处理的硬件组成有直接的相互关系,除此之外还有赖于应用技术的因素,如虚拟场景的复杂程度和图形模块生成所需的真实感等等。

7. VR技术在各国的研究情况

①VR技术在美国的研究现状

美国是虚拟现实技术研究的发源地,虚拟现实技术的诞生可以追溯到上世纪40年代。最初研究的虚拟现实技术只是用于美国军方对飞行驾驶员和宇航员的模拟训练。然而,随着冷战结束后美国军费大大的削减,虚拟现实技术就逐渐转为民用,目前美国在该领域的基础研究主要集中在感知、用户界面、后台软件和硬件四个方面。

上个世纪80年代,美国宇航局及美国国防部组织了一系列有关虚拟现实技术的研究,并取得了令人瞩目的研究成果,美国宇航局Ames实验室致力于一个叫“虚拟行星探索”的实验计划。现在美国宇航局已经建立了航空、卫星维护的模拟训练系统,空间站的模拟训练系统,并且已经建立了可供全国使用的模拟教育系统。北卡罗来纳大学的计算机专业就是进行虚拟显示技术研究最早最著名的大学。他们主要研究分子建模、航空驾驶、外科手术仿真、建筑仿真等。乔治梅森大学研制出一套在动态虚拟环境中的流体实时仿真系统。施乐公司研究中心在模拟现实技术领域中主要从事利用VRT建立未来办公室的研究,并努力设计一项基于模拟现实技术使得数据存取更容易的窗口系统。波音公司的波音777运输机采用全无纸化设计,利用所开发的虚拟现实系统将虚拟环境叠加于真实环境之上,把虚拟的模板显示在正在加工的工件上,工人根据此模板控制待加工尺寸,从而简化加工过程。

图形图像处理技术和传感器技术是以上VR项目的主要技术。就目前看,空间的动态性和时间的实时性是这项技术的最主要焦点。

②VR技术在欧洲的研究现状

在欧洲,英国在VR开发的某些方面,特别是在分布并行处理、辅助设备(包括触觉反馈)设计和应用研究方面。在欧洲来说是领先的。英国Bristol公司发现,VR应用的交点应集中在整体综合技术上,他们在软件和硬件的某些领域处于领先地位。英国ARRL公司关于远地呈现的研究实验,主要包括VR重构问题。他们的产品还包括建筑和科学可视化计算。

欧洲其它一些较发达的国家如:荷兰、德国、瑞典等也积极进行了VR的研究与应用。

瑞典的DIVE分布式虚拟交互环境,是一个基于Unix的,不同节点上的多个进程可以在同一世界中工作的异质分布式系统。

荷兰海牙TNO研究所的物理电子实验室(TNO- PEL)开发的训练和模拟系统,通过改进人机界面来改善现有模拟系统,以使用户完全介入模拟环境。

德国在VR的应用方面取得了出乎意料的成果。在改造传统产业方面,一是用于产品设计、降低成本,避免新产品开发的风险;二是产品演示,吸引客户争取定单;三是用于培训,在新生产设备投入使用前用虚拟工厂来提高工人的操作水平。2008年10月27-29日在法国举行的ACM Symposi- um on Virtual Reality Software and Technoogy大会,整体上促进了虚拟现实技术的深入发展。

③VR技术在日本的研究现状

日本的虚拟现实技术的发展在世界相关领域的研究中同样具有举足轻重的地位,它在建立大规模VR知识库和虚拟现实的游戏方面作出了很大的成就。

在东京技术学院精密和智能实验室研究了一个用于建立三维模型的人性化界面,称为SpmAR NEC公司开发了一种虚拟现实系统,用代用手来处理CAD中的三维形体模型。通过数据手套把对模型的处理与操作者的手联系起来;日本国际工业和商业部产品科学研究院开发了一种采用x、Y记录器的受力反馈装置;东京大学的高级科学研究中心的研究重点主要集中在远程控制方面,他们最近的研究项目是可以使用户控制远程摄像系统和一个模拟人手的随动机械人手臂的主从系统;东京大学广濑研究室重点研究虚拟现实的可视化问题。他们正在开发一种虚拟全息系统,用于克服当前显示和交互作用技术的局限性;日本奈良尖端技术研究生院大学教授千原国宏领导的研究小组于2004年开发出一种嗅觉模拟器,只要把虚拟空间里的水果放到鼻尖上一闻,装置就会在鼻尖处放出水果的香味,这是虚拟现实技术在嗅觉研究领域的一项突破。

④国内虚拟现实技术研究现状

在我国虚拟现实技术的研究和一些发达国家相比还有很大的一段距离,随着计算机图形学、计算机系统工程等技术的高速发展,虚拟现实技术已经得到了相当的重视,引起我国各界人士的兴趣和关注,研究与应用VR,建立虚拟环境、虚拟场景模型分布式VR系统的开发正朝着深度和广度发展。国家科委国防科工委部已将虚拟现实技术的研究列为重点攻关项目,国内许多研究机构和高校也都在进行虚拟现实的研究和应用并取得了一些不错的研究成果。

北京航空航天大学计算机系也是国内最早进行VR研究、最有权威的单位之一,其虚拟实现与可视化新技术研究室集成了分布式虚拟环境,可以提供实时三维动态数据库、虚拟现实演示环境、用行员训练的虚拟现实系统、虚拟现实应用系统的开发平台等,并在以下方面取得进展:着重研究了虚拟环境中物体物理特性的表示与处理;在虚拟现实中的视觉接口方面开发出部分硬件,并提出有关算法及实现方法。

清华大学国家光盘工程研究中心所作的“布达拉宫”,采用了QuickTime技术,实现大全景VR制;浙江大学CAD&CG国家重点实验室开发了一套桌面型虚拟建筑环境实时漫游系统;哈尔滨工业大学计算机系已经成功地合成了人的高级行为中的特定人脸图像,解决了表情的合成和唇动合成技术问题,并正在研究人说话时手势和头势的动作、语音和语调的同步等。

8.学习小结和心得

第8篇:计算机视觉研究的目的范文

关键词:计算机软件;课程教学;CorelDRAW

中图分类号:J05 文献标识码:A 文章编号:1005-5312(2013)24-0161-02

一、计算机软件CorelDRAW的课程教学目标

根据视觉设计专业人才培养方案,计算机软件CorelDRAW的课程教学目标为,熟练掌握软件的操作技巧,能够运用CorelDRAW软件绘制艺术化的矢量图形图标和编排有艺术效果的图文版面。

二、计算机软件CorelDRAW课程教学中的常见问题

CorelDRAW是一款专业的矢量图形绘制软件,有强大的矢量图形绘制功能和便捷的图文编排工具。目前课堂教学中常见的问题主要集中在,一是没有根据所学专业详略得当地安排教学内容,每种工具命令都泛泛而讲,不利于学生对重点知识的熟练掌握和深入探究;二是课堂练习安排没有层次性和趣味性,重复枯燥的练习不仅磨灭学生的学习积极性,也扼杀了学生的创造力;三是学习效果反馈缺乏及时性和针对性,没有因材施教的课堂不能保证教学的质量和效率。

三、视觉设计专业的计算机软件特色课程模式研究——以CorelDRAW课程教学为例

根据教学中存在的问题进行课程模式的思考探索,认为课程教学第一个关键点是要有专业针对性,要根据视觉设计专业重点运用的领域安排教学内容和组织课堂教学,所以提出针对性强、循序渐进和因材施教的渐层型课程模式;第二个关键点是要有教学效率和教学效果,所以提出能激发学生专业热情和培养学生专业能力的效能型课程模式。

(一)渐层型课程模式——关于课程内容学习的探索与实践

“渐层型课程”是指在本专业计算机软件教学中,教师引导学生进行循序渐进不同层次的迁移应用和绘制要求,其理论依据是斯金纳(BurrhusSkinner)程序教学模式,这种教学模式具有极强的操作性,有利于学生系统掌握知识和技能、循序渐进地学习,并能及时反馈强化所学知识,同时培养学生的自学能力。

1.渐层型课程模式专业针对性强

渐层型课程模式的构建思路是针对专业特点来设置教学内容和用80%的时间熟练掌握20%的重点知识。

视觉设计专业学生的核心课程一般为文字设计、版式设计、海报设计、书籍设计、包装设计和品牌推广等,所以CorelDRAW课程教学,应将这些设计类别需要用到的计算机辅助领域作为教学重点,用80%的课程时间来熟练掌握视觉设计专业辅助设计常用到20%的重点知识,并将后续专业学习的实际设计项目作为课堂练习和考核的重点内容。

2.渐层型课程模式遵循渐进规律

在CorelDRAW课程教学中,教师通过知识新授、牵扶帮学和延伸自学来循序渐进安排课程教学,能有效优化课堂教学质量。

知识新授环节要注重培养学生对指定目标的学习能力,首先以温故知新和思维启发为切入点,用三遍不同层次的讲解演示和学生独立操作相配合来达到新授、巩固、强化重点难点的学习效果。

牵扶帮学教学阶段根据具体实际情况,可以通过教师出示图文说明的操作提示帮助学生掌握重点和突破难点,也可以通过放手学生独立操作后的师生共同讨论及解题新思路的探索来深化学生的操作技术。

延伸自学的教学阶段要善于创设自学延伸的学习情境。具体措施有:在自学基础上进行举一反三的延伸学习;也可以先不看教程自学探索,之后再将自己的操作和教程操作进行对比分析来深化对技巧的理解;或者提供高质量的图形案例和更多自学网站自学书籍的信息,让学生在更加深广的学习情境中充满学习热情地自由驰骋。

3.渐层型课程模式注意因材施教

因材施教的课堂实施手段主要包括:一是教师逐个当堂反馈学习效果,这利于调动学生学习积极性、有利于教师掌握学生实际学习能力来与学生开展良性互动、有利于落实学生的当堂学习情况集中讲解容易出现的问题,保证教学质量;二是分层次针对有差异的个体开展学习引导,这能有效避免有的学生觉得练习太容易,完成后无事可做,有的学生则畏难不愿学习,失去学习兴趣的情况;三是根据个体差异来设置具备必选标准性和可选自由性的作品考核形式,能更真实地考核学生实际操作能力,激发学生的学习主动性,还能再一次大幅度提升学生软件操作技巧,为后阶段的专业课程学习和毕业设计积累丰富的计算机造型技术。

4.渐层型课程模式的实践效果

渐层型课程模式首先从课程内容安排上体现出针对性强和重点突出的渐层性,其次在课堂教学中体现出循序渐进符合学生认知规律的渐层性,最后在课堂教学反馈和课程考核差异性设置中体现出渐层性,渐层型课程模式由浅入深,由表及里,让CorelDRAW的课程教学充满学习的乐趣和努力的进阶,学生不仅能学会课程知识,还能提高举一反三的思维水平和开发探索研究的自学潜能。

(二)效能型课程模式——关于专业素质养成的探索与实践

采取效能型课程模式来进行CorelDRAW的课程学习,是关于专业素质养成的探索与实践。根据奥苏贝尔(DavidAusubel)有意义的接受型学习教学理论和先行组织者教学模式,提出视觉设计专业计算机软件的教学特色研究方向“效能型课程”模式,是指高效高能的课程模型,“高效”即课堂效率高,“高能”即学生能力强。

视觉设计专业的学生要具备高素质的专业素养和独特的创意能力,计算机软件教学在培养学生专业能力,掌握数码造型技术的同时,也应该注意激发学生的专业热情。

1.效能型课程模式能激发学生的专业热情——高效

简化创作流程和细化制作任务这两种教学措施能有效提高计算机软件教学的课堂效率,让学生乐学愿学,从而激发学生对本专业的学习热情和学习期待。

简化制作流程是简化学生概念创意的难度,但同时又给予学生根据设计实例自由发挥的空间,不仅能保证作品的视觉美观度,还能有效启发学生的设计创造力和对专业的学习热情。二年一期的学生并没有进入核心设计课程的学习,所以不具备很专业的设计创意能力。在CorelDRAW的课程学习中,如果按照一般的创作流程,让学生先创意再画草图,然后制作电子稿,不仅和其他类型课程的考核内容重复,也没有达到计算机软件以技术考核为主的课程重点,同时学生因为没有很好的创意和设计技巧,即使软件操作能力很强,绘制的作品也往往不具备一定程度的审美水平,视觉效果不美观的软件绘制作品会夸大学生现阶段较薄弱的设计能力,这种挫败感往往伤害到学生对视觉设计专业的热情。所以,通过简化创意过程,强调制作技术和对已有案例进行延续设计的作品考核方式,能在保证作品审美水平的前提下更大程度激发学生探索运用软件设计制作的学习热情。

细化制作任务能保证学生一步一步落实学习目标,最终高质量完成学习任务。以课程考核为例,将制作VI手册这个整体目标,逐个分解细化,每个任务难度合理把握在学生跳一跳能完成的程度,学生通过一次次努力累积最终如期完成体现自己最大制作能力的课程考核作品,这一学习过程能极大鼓舞学生的学习热情和对专业设计课程的期待与向往。

2.效能型课程模式能培养学生的专业能力——高能

在计算机软件的课程学习中培养学生专业能力主要有两种教学措施,一是强化重点知识,二是深化操作技巧。

强化重点知识要求不仅是课程作品考核,包括整个课堂讲授和课堂练习都要围绕这些操作重点合理设置,展开教学。CorelDRAW的工具命令进行初级操作比较简单,但是熟练掌握就需要反复练习和不断强化,而要达到灵活运用的程度则需要通过恰当的教学方法进行引导,才能真正深化学生的操作技巧。

深化操作技巧主要运用对比分析、迁移应用等教学措施来实现。如特效文字的操作技巧就是用对比分析法来深化学生对操作技巧的理解,案例用一段文字和正圆形的融合为切入点,运用不同的工具编辑文字和正圆,能产生多种不同的视觉效果,通过对比分析能有效深化学生的操作技巧。再如用三种软件绘制同一对象的练习,就是采取迁移应用的教学方法来弱化学生对画面变化的关注度,从而增强学生对软件工具深入理解和综合应用的关注度。深化学生对重点工具的探索运用还可以用系列案例剖析、不同案例对比、案例自学和已有案例延续设计等教学手段来实现。

3.效能型课程模式的实践效果

效能型课程模式的具体教学实践环节不仅能使学生熟练基本操作知识,提升重点制作技巧,同时还能协调学生软件制作能力和实际创作水平的差异,提高课堂效率,潜移默化为学生铺垫良好的审美趣味和准确的专业素养,增强专业课程的整体持续性和纵向联系度。

四、视觉设计专业计算机软件特色课程模式探索与实践研究的意义和作用

(一)对本门课程产生的意义和作用

综上所述,计算机软件特色课程模式——渐层效能型课程研究是针对视觉设计专业学生的软件学习现状提出的,在CorelDRAW的课程教学实践中,呈现专业特色突出,课堂操作可行,教学效果明显的实际应用意义。

(二)对横向课程产生的意义和作用

视觉设计专业学生需要掌握的计算机软件包括4门静态图像造型软件和2门动态图像造型软件。视觉设计专业计算机软件特色教学研究项目——渐层效能型课程模式,能规范本专业多门计算机软件课程的整体教学模式,能提高学生的学习效率,缩短学习周期。

(三)对纵向课程产生的意义和作用

渐层效能型课程模式能继续深化纵向的课程延伸,以儿童视觉产业为例,渐层效能型特色课程模式可以纵向应用在儿童产品软件课程的教学中,并进一步发展延伸到儿童产品设计的媒体技术开发中。

五、结束语

视觉设计专业计算机软件特色课程模式——渐层效能型课程模式,构建了视觉设计专业计算机软件教学的有机课程体系,提供了规范的课程模块,同时为视觉设计专业其他课程开拓了更多横向和纵向的教学研究方向。

注:1.本文为长沙师范学院课题项目经费支持,项目名称为:视觉设计专业计算机软件教学特色研究——渐层效能型课程模式,编号:XXZD201105;2.本文为湖南省教育科学“十二五”规划项目研究,名称为:基于数码造型平台的艺术设计类课程有效教学研究。

参考文献:

[1][捷克]夸美纽斯.大教学论[M].傅任敢译.北京:人民教育出版社,1984.

第9篇:计算机视觉研究的目的范文

(1)课程内容方面:工程应用价值较小的内容居多;具备工程应用价值的方法,如基于结构光的3D信息获取,在课程内容中却极少出现。

(2)课程定位方面:现有课程体系中未能体现最新研究成果,而掌握世界最新工程应用成果是卓越工程师的基本要求之一。

(3)教学形式方面:传统计算机视觉课程侧重基本原理,尽管范例教学被引入到课堂教学中,在一定程度上帮助学生理解,但卓越工程师培养目标是培养学生解决实际工程问题的能力。针对卓越工程师培养目标,以及目前计算机视觉课程中存在的问题,本文提出工程应用导向型的课程内容、面向最新成果的课程定位、理论实例化与工程实践化的教学形式,以培养具有扎实理论基础及工程实践能力的卓越工程师。

1工程应用导向型的课程内容传统计算机视觉课程围绕Marr理论框架展开教学,其中部分原理仅在理想状态或若干假设下成立,不能直接运用到工程实践中。近年来已具备工程应用基础的原理及方法,在传统课程内容中较少出现,如已在工业测量、视频监控、游戏娱乐等领域中应用的主动式三维数据获取方法等。我们对工程应用价值高的课程内容,增加课时,充分讲解其原理及算法,并进行工程实例分析;对工程应用价值较低内容,压缩课时,以介绍方法原理为主。例如,在教授3D信息获取部分时,课时主要投入到工程应用价值较大的内容,如立体视觉、运动恢复结构、基于结构光的3D信息获取等;而对于基于阴影的景物恢复等缺乏应用基础的内容主要介绍其基本原理,并引导学生进行其工程应用的可行性分析,培养学生缜密的思维习惯,训练学生辩证的分析能力。

2面向最新成果的课程定位计算机视觉近十年来发展迅速,新方法和新理论层出不穷,在现有课程体系中未能得以体现。跟进世界最新成果是卓越工程师的基本要求之一,因此计算机视觉课程定位应当面向国际最新成果。为实现这一目标,我们主要从以下两方面入手。

(1)选用涵盖最新成果的教材。我们在教学中加入国际最新科研成果及应用范例,在教材选取上采用2010年RichardSzeliski教授所著《Computervision:algorithmsandapplications》作为参考教材。该书是RichardSzeliski教授在多年MIT执教经验及微软多年计算机视觉领域工作经验基础上所著,涵盖计算机视觉领域的主要科研成果及应用范例,参考文献最新引用至2010年。这是目前最新的计算机视觉著作之一,条理清晰,深入浅出,特点在于对计算机视觉的基本原理介绍非常详尽,算法应用紧跟国际前沿。

(2)强化学生调研及自学能力。“授之以鱼”,不如“授之以渔”。在教授学生的同时,更重要的是培养学生调研、跟踪、学习并分析国际最新科研及工程应用成果的能力。为强化学生的知识结构,培养学生跟踪国际前沿的能力,我们在教学中加入10%的课外学时,指导每位学生完成最近三年本领域的国际最新文献调研及工程应用新技术调研,并撰写相关调研论文。同时,设置2学时课内学时,让每位学生介绍调研成果,并进行课堂讨论。在调研基础上,选择相关算法进行了实验证明,进一步强化学习成果。实践证明,由于学生能够根据自己的兴趣,选择本领域感兴趣的课题进行深入调研,极大地调动了学生的积极性,强化了学生调研、跟踪、学习并分析国际最新科研及工程应用成果的能力。

3工程实践化的教学形式我们在教学中提出工程实践化的教学形式,即以人类视觉功能为背景,由相应工程实例引出相关理论,并最终将理论运用到工程实例中的算法和方法传授给学生。