公务员期刊网 精选范文 计算机视觉的优点范文

计算机视觉的优点精选(九篇)

计算机视觉的优点

第1篇:计算机视觉的优点范文

关键词:单目;视觉里程计;SURF算法;卡尔曼滤波

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)43-0257-03

移动机器人的自主定位导航是机器人运动的前提之一,随着计算机技术和图像处理技术的发展,利用机器视觉进行导航逐渐成为热点之一[1]。视觉里程计(VO)通过轨迹推算,累加运动矢量,得出当前位置的相对定位,从而帮助机器人感知周围环境和自由移动。对比双目里程计,单目里程计仅使用单个相机作为图像获取载体,使获得信息的要求更低,实时性好,成本也更少,因此具有更广的应用前景[2]。本研究课题引入机器学习算法,对传统单目视觉里程计进行改良,提出了一种新的解决方案,优化单目视觉里程计,对后期的工程应用有一定的实践意义。

一、设计单目视觉里程计系统模型

单目视觉里程计模型设计分为:硬件设计和软件设计。硬件设计就是安装在机器上带有调节机构的单个相机。软件模型设计包括:图像的采集和预处理、目标的选取特征与运动估计等模块,其软件设计工作流程如图1所示:

图1中,在采集到图像后,要进行滤波、图像矫正、标定参数等预处理,相机参数标定获得的参数能将现实三维与相机二维图像联系起来,是单目里程计能否准确定位的关键[3],本课题采用张友正的棋盘标定法,较其他算法实现起来更简单,准确度较高。

图片在成像过程中会出现畸变、失真等情况,可以采用灰度插值法或双线条插值法进行矫正,以起到减小里程计误差的作用。由于估算图像特征的运动参数是估算相机运动的关键,因此特征的选取显得尤为重要。选择具体的物体作为特征,在复杂的外部环境中是不现实的,所以,应该尽可能的选择简单,明显的点线面、角点、特定区域作为特征。在计算图像特征运动时,需要检测出两幅连续的图像中对应的特征点,然后找出所有特征点之间的对应关系进行匹配[4]。常用的特征点提取算法有Harris角点检测算法,SUSA(smallest univalve segment assimilating nucleus)角点检测算法,SIFT,SURF,FAST角点算法等。Harris算法定义局部领域内极大兴趣值对应的像素点为检测的特征点,并不如SURF(Speeded Up Robust Features)算法选取的特征点明显[5],所以相较于两者SURF更适合于本课题的研究,SURF基于积分图像提取特征点,通过Haar小波滤波器描述特征点,是一种集特征提取和描述于一体的算法,其抗干扰能力强,运算量低于SIFT算法,运算速度却更快,并且结合了SIFT算法的许多优点,因此本文选用SURF算法进行特征提取和匹配。由于SURF算法具有平移、旋转时尺寸不变的优势,因此所检测出的特征无论在哪个角度都是同一个特征,首先给特征点确定一个主方向,以特征点为原点,建立二维直角坐标系,获得一个64维特征向量r来描述特征点。之后SURF对特征点的匹配就可分为两步:第一步,快速索引进行初步匹配,但是会存在较大的误差,第二步进行最近邻匹配算法运算,若最近邻欧氏距离与次近邻欧式距离的比值在一定阈值范围内,则认为特征点匹配正确,反之则是匹配错误[6],能快速有效的剔除错误的匹配点。SURF算法的流程图如图2所示:

SURF最近邻欧式距离算法如式1所示:

dis(j)=(dis(rr)) (式1)

SURF次近邻欧氏距离算法如式2、式3所示:

dis(j)=(dis(rr)) (式2)

R= (式3)

式(1)中,dis(j)――两个特征点间的最近邻欧氏距离,r中第j个向量与r中第i个向量的欧式距离最小;

式(2)中,dis(j)――两个特征点间的次近邻欧氏距离,r中第j个向量(除第j个向量外)与r中第i个向量的欧式距离最小;

式(3)中,R为最近邻欧氏距离与次近邻欧氏距离之比。设阈值为R,当R≤R时,特征向量匹配成功,反之则失败。

二、单目视觉里程计目标定位:

在设计完单目视觉里程计的模型后,进行计算,得出现实中的点的三维坐标;首先先确立相机的位置关系,就是在本质矩阵E(一个有5个自由度,秩为2的三阶矩阵)中分解出旋转矩阵R和平移向量T,可以由E=UDV,计算出R=UGV,其中G=,

Z=。而得到的平移向量T是一个比例值,只能根据现实数据计算出,因此平移向量还是一个未知数。在现实相机标定时可直接选用张友正的棋盘标定算法,使用ROS下的标定库,通过camera_calibration直接标定插入电脑的相机,当拍摄照片达到一定量之后,标定程序会自动开始计算各种参数,我们只需要选定焦距值,图像尺寸大小,主点坐标(u,v)。知道两张相片的坐标分别为A=(x,y,z),A=(x,y,z),可以通过数学计算来获取目标的三维坐标, 由先前得到的相机坐标位置关系可得式4:

A=RA+T (式4)

由于(u,v)和(u,v),R,T均可得出所以可以求出x,y如式5所示:

x=y= (式5)

z和平移系数可由最小二乘法得出。算出结果后我们可以的得出A=(x,y,z)为当前相机坐标系下算出的目标点的三维坐标,因此目标点被定位成功。

三、基于机器学习算法的Kalman滤波改良设计

卡尔曼滤波器(Kalman Filtering)是一种软件滤波方式,以最小方差估计为算法基础,通过状态方程来描述被估计量的动态变化过程,利用相机上一时刻的状态和当前时刻传感器的测量值来估计当前的状态值[7]。基本卡尔滤波器算法,适用于解决随机线性离散系统的参数估计问题,卡尔曼滤波器在滤波过程中不需要存储历史数据,有效地减少了计算量,大大节省了运算时间。但是基本卡尔曼滤波器会因为实际噪声和其使用的噪声不相符,而导致滤波运算精度低,甚至会出现滤波器发散的现象。为了直观地理解卡尔曼滤波器的应用,可给出其运行流程图如图3所示:

研究者们曾提出自适应卡尔曼滤波器(AKF)来克服这一缺点,其中Sage-Husa自适应滤波器算法因为原理简单,实时性好,受到广泛的关注,但存在着时间窗口难以设置的问题,时间窗口是指测量数据选取的时间长度,若设得过大,算法效率会变得很低,动态性能也变差;若过小,算法中用到的数据就显得过少,估算出的当前相机状态值会发生偏差。所以本文介绍了一种基于机器学习算法SVM(支持向量机)的自适应卡尔曼滤波设计方法。支持向量机(SVM)是一种将结构风险最小化的机器学习算法[8],在解决非线性问题领域有着极大的优势,恰好在基于SVM的新型自适应卡尔曼滤波算法中,正是运用SVM的回归预测分析(SVR),将原本复杂的非线性问题通过构造线性函数转化成线性问题,进而动态的调节卡尔曼滤波器算法中的噪声矩阵参数。巧妙地避开了选取时间窗口的难题,并且这一新型的算法增加了单目里程计的稳定性和准确性。

四、提高单目里程计算法的研究

如何提高单目里程计算法,可以从三个角度进行分析:鲁棒性、实时性和精确度。

1.提高系统的鲁棒性。鲁棒性可以是指,控制系统在参数摄动情况下保持系统某个性能指标保持不变,即抗干扰能力。在视觉里程计中,局部视觉特征能有效的提高系统的鲁棒性,局部视觉特征有尺寸不变特性,并且对复杂的外部环境有很好的检测能力,适用于室外等复杂场地,若与GPS等设备结合使用,实现多传感器信息融合。

2.提高系统的实时性。在特征检测和匹配时,选取有效的少量特征进行检测和匹配,并运用好的数据加以描述,能有效的提高系统的实时性,简而言之,特征的选取要易跟踪,匹配算法要高效可行。可以从两个角度提高算法的实时性:数据处理并行优化和数据降维。数据降维能高效利用有限的计算能力,主成分分析PCA(Principle component analysis)方式已有效的运用于SIFT数据降维中,可以在大大降低计算量的情况下,达到了相同的特征匹配效果。

3.提高系统的精确度。视觉里程计是一个数据迭代累加的过程,但在迭代累加过程中,都会存在误差的累积,如何有效地减少误差的累加,就成了视觉里程计特高精确度的关键。减少误差的累加,应该从选取特征点这一源头开始。由此特征的选取,检测和匹配都要选择合适的方式[9]。特征点的选取应尽量选择静止物体的显著特征,减少特征带来误差和大量的无用外点。运用图的最大团内点检测方法对错误匹配有很强的制约能力。

视觉里程计作为移动机器人自主导航的重要组成部分,已成功运用于海陆空及宇宙探索中,本文主要研究了一种基于机器学习算法的单目里程计算法,仅使用一个摄像机,在不借助于其他传感设备的帮助下,实现机器的自主定位。本课题引入SURF算法对目标进行特征匹配,提高了系统的鲁棒性,同时较SIFT算法提高了运算速度。利用机器学习改善传统的卡曼滤波,有效的抑制了噪声发散。通过上述改善,本课题所研究设计的单目里程计在鲁棒性、实时性和精准性上有了一定的提高。

参考文献:

[1]姜国权,何晓兰,杜尚丰,柯杏.机器视觉在农业机器人自主导航系统中的研究进展[J].农机化研究,2008,(3):9-11.

[2]罗堪.基于复眼模型的视觉里程计方法研究[D].湖南大学,2014.

[3]刘晓利,田媛,童飞,唐舰,隋国荣,陈抱雪.双目立体视觉的光学标定技术[J]光学仪器,2013,(3):11-15.

[4]苏宇,郭宝龙.一种基于曲率尺度空间的图像拼接算法[J].计算机工程与应用2008,(1):39-41.

[5]相阳.基于点特征的图像配准技术研究[D].东北大学,2010.

[6]白廷柱,侯喜报.基于SIFT算子的图像匹配算法研究[J].北京理工大学学报,2013,(6):622-627.

[7]戴洪德,陈明,周绍磊,李娟,彭贤.基于支持向量机的自适应卡尔曼滤波技术研究[J].控制与决策,2008,(8):949-952.

[8]张泼簦汪艳,郭天太,洪博,刘焱煜.支持向量回归机的参数择优算法[J].中国科技信息,2015,(13):26-27.

[9]李宇波,朱效洲,卢惠民,张辉.视觉里程计技术综述[J].计算机应用研究,2012,(8):2801-2805,2810.

A Study on Monocular Mileage based on Machine Learning Algorithm

GU Hai-yan 2,CHEN Ying-jie 1,DING Yao 1

(1.Nanjing University Jinling College,Nanjing,Jiangsu 210089,China;2. Jiangsu Police Institute,Nanjing,Jiangsu 210000,China)

第2篇:计算机视觉的优点范文

【关键词】计算机图形图像设计 视觉传达设计 研究

早在20世纪80年代,欧美发达国家已经在图形图像设计中,引入了计算机技术。后来,在计算机科技的快速发展下,电脑制图也越来越普遍,并受到了广大客户的认可。然而,由于计算机技术被更加重视,导致图形图像设计中缺乏创新元素,甚至造成了审美疲劳。鉴于此,必须将计算机技术与图形图像设计紧密结合,以此来创造最佳的设计效果,最终满足人们的审美需求。

1 基本概念

1.1 计算机图像图形设计

计算机图像图形设计指的是:在计算机技术的支持下,完成图形图像的设计与制作。随着计算机的快速发展,诞生了更多的新技术。其中,计算机图像图形设计就是一种。该技术诞生后,产生了积极的社会效益。与传统的设计方法相比,具有更大的优势。表现在这几个方面。首先,在计算机图像图像设计中,设计师可以可以利用软件来完成更多的辅工作。在此基础上,提供了工作效率。同时,可以将节省出来的时间运用到创意思考方面,培养出更多的设计灵感。其次,在计算机软件中,拥有更多、更丰富的色彩、线条,为设计者提供了更多的选择。与手工制图相比,具有更大的优势。除此之外,在计算机制图中,对设计者的美术基础训练没有过高要求。再加上技术的快速发展,不断简化了相关操作,给初学者提供了更大方便。

1.2 视觉传达设计

人类在交流的过程中,通过语言或者非语言的方式,来传达信息。最早,人类主要是利用语言来传达信息。与语言传达不同,非语言传达是通过视觉与听觉来传递信息。从范围上来看,最广泛的就是视觉传达。在视觉传达设计中,就是利用视觉传达的办法,对各种信息进行设计,使其成为作品。举个例子,设计师在创作的过程中,根据色彩、形象、大小等,传递出想要表达的信息。视觉传达设计包括多个内容,最常见的为文字、图形、标志、符号等。在表达的过程中,其途径通常为:广播、电视、报纸、网络等。传达的群体比较广泛,包括社会中的所有受众。

2 计算机图形图像设计与视觉传达的异同点

2.1 计算机图形图像设计与视觉传达的相同点

2.1.1 历史背景不同

计算机图形图像设计在20世纪末开始兴起。进入新世纪后,在运行速度、网络通信、储存功能方面得到了完善。实现了多个设备的联合使用,包括打印机、绘图仪,多媒体等,扩大其设计的范围。从兴起时间来看,视觉传达设计在20世纪四十年代兴起,比计算机图像图像设计的时间更早。视觉传达设计加快了商品经济的流通,加强了绘画与广告业务的结合,对传统传达方式造成了极大冲击,其地位日趋重要。因此,视觉传达的诞生,在很大程度上促进了视觉传达设计的发展。

2.1.2 设计任务不同

计算机图形图像设计的作品以动态型为特点,将平面的、静止的画面转换为立体的、三维的、动态的作品。与此同时,视觉传达在设计作品时,主要是通过视觉传达的方式,来传递作者想要表达的信息。所以,在视觉传达设计中,并未对作品的形式作出硬性规定。只要能表达出信息即可。视觉传达设计在传达信心的过程中,也树立了形象,达到了说服观众的目的。同时,也表现出了一种艺术美感。

2.1.3 培训方法不同

在计算机图形图像设计培训中,主要依赖于计算机技术。针对初学者来说,必须掌握基础性的计算机技术。包括排班技术、印刷技术、视频技术。除此之外,还要掌握必要的作品设计知识。视觉传达设计的目的在于向公众传递信息,传递美感。所以,学习者必须具备多方面的知识,包括设计学、广告学、美术学,以及传播学等。针对初学者来说,在培训的过程中,要掌握美术史、设计史、广告通论方面的基础知识。同时,还要训练相关的技能。包括产品包装、装帧、广告设计等。与计算机图形图像设计相比,视觉传达创作更倾向于美术作品创作。所以,设计师必须要掌握绘画的技巧,对光、线、色彩、形态进行合理调整,然后将自身的思想融入到作品当中。在此基础上,达到传神的效果。

2.1.4 创造方法不同

计算机图像图像设计作品时,主要应用多种计算机软件。所以,设计师要熟练掌握相关软件,合理搭配图形与色彩,把握空间美、视觉美,以此来创造出动静结合的艺术作品。

2.2 两者的相同点

首先,二者均为艺术作品。从这一层面上来看,存在很多相同的领域。比如,在设计的过程中,都要掌握平面设计、素面、色彩方面的知识。另外,二者在传递信息的过程中,均以文化符号为途径。最后,为了取得更大的效应,要求设计师具有一定的创新性。除此之外,在设计的过程中,要遵循相关的创作规范、原则,并考虑到美术创作中的多种元素。在此基础上,提高作品的含金量。

3 结束语

可以看出,计算机图像图像设计与视觉传达设计相互联系,相互影响。因此,在新的发展使其,必须将二者紧密结合,在发挥其共同优势的基础上,达到技术与艺术的完美结合。本文首先分析了二者的不同点,然后分析了其相同点。希望在未来结合应用的过程中,可以为相关人员提供参考意见,最终推动二者的全面发展。

参考文献

[1]张金龙.计算机图形图像设计与视觉传达设计研究[J].吉林广播电视大学学报,2013(01):117-118+153.

[2]邵玉兰,赵昕.关于计算机图形图像设计与视觉传达设计的分析[J].信息与电脑(理论版),2013(03):45-46.

第3篇:计算机视觉的优点范文

1.1自动化程度高

计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。

1.2实现无损检测

由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。

1.3稳定的检测精度

设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。

2计算机视觉技术在食品检测中的应用

20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚20多年,但是发展很快。

2.1计算机视觉技术在果蔬分级中的应用研究

计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图象处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco.J[15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。王江枫等[17]建立了芒果重量与摄影图像的相互关系,应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤,按重量分级其准确率均为92%,按果面损伤分级的准确率分别为76%和80%。

2.2计算机视觉技术在禽蛋检测中的应用研究

禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和BET算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。MertensK等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。

2.3计算机视觉技术在检测食品中微生物含量的应用研究

计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar.B等[26]人采用计算机视觉技术、光散射技术(BARDOT)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有,对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征和微生物数量进行识别,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。

2.4计算机视觉技术在其他食品产业中的应用研究

里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。GokmenV等[33-34]通过对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率的关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等[35]人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等[36]人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。

3展望

新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。

3.1检测指标有限

计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大[37]。例如,Davenel等[38]通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花萼和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。Nozer[39-40]等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。

3.2兼容性差

计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是,同一套系统和设备很难用于其它种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等[41]利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。Majumdar.S等[42]利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。

3.3检测性能受环境制约

第4篇:计算机视觉的优点范文

关键词:美术教学 计算机辅助教学 优越性

在科学技术发展的今天,集声、光、电等为一体的多媒体技术,以其高效、快捷、全面传授知识,保存、收集资料相互交流等优势,极大促进了整个教学的改革和发展。其中以形象直观的美术教学最为受益。计算机辅助教学,因其能激发学生的学习兴趣、促使学生主动学习、提高课堂教学效率等诸多优点,而成为现代课堂教学中最常用的教学手段之一,广泛应用在中小学各学科的教学中,美术教学也不例外。使用计算机辅助教学,能更好地突出教学重点,突破教学难点。特别是在突破传统教学的诸多难点上,计算机可以发挥无可比拟的优越性。中小学美术教学中的难点,是在教材的教授过程中,学生对知识的难以理解之点,技法的难以掌握之处。以下举例介绍计算机辅助教学解决中小学美术教学难点的一些应用。

1、获得独特的视觉效果

使用计算机辅助教学可以充分利用计算机的特点,根据教学需要,获得独特的数码虚拟视觉效果,协助教师突破教学中的难点。美术欣赏课有很强的直观性,使用计算机辅助教学,通过数码投影仪,就可以将作品清楚地放大展示,让学生在欣赏课上能够真正地“欣赏”。以七年级第十四册《现代生活的视觉语言》一课为例,通过欣赏不同年代、不同形式的标志,使学生开阔眼界,丰富知识。标志很小,教师拿在手中展示,学生想要看清楚都很费劲,更别说欣赏了,对教师而言,同样也不便于知识的讲解。而若通过计算机和数码投影仪,将各种标志投影成2 米见方的影像,就可以让课堂上的每个学生都能看得清楚,达到最佳的审美感受。同时还可以放大局部进行有针对性地观察,教师结合知识重点、难点进行分析讲解。由此,视觉的传达与知识的传授相得益彰,让学生在审美体验中学习和提高。

欣赏三维造型艺术时,计算机辅助教学不仅可以用通常的视觉方式,让学生欣赏到物体在某一视觉角度的造型或其内部构造,而且可以做出“动感显示”效果,让三维物体旋转起来,欣赏到它的各个侧面,让学生体会到物体的立体感、空间感。比如九年级第十八册《现代建筑》一课中,计算机辅助教学可以按预先设置路线,带领学生虚拟浏览一座建筑物的内部装饰、陈设,使学生有现场感、真实感,真切地感受到不同时代、不同地域、不同空间的建筑风格,同时,也会真正理解它的三维结构。利用计算机辅助教学,产生真实新奇的视觉效果,独特的感染力,将使学生对这一课留下难忘的印象。

2、动态展示变化的过程

计算机具有强大的多媒体功能,集文字、图像、图形、声音、动画和视频为一体。教师可以根据教学需求,通过计算机表现许多传统教学技术不能表现的事物和现象,如演示形象生动的动画,声情并茂的有声画面,色彩丰富的教学图片等。CAI 可以使抽象问题形象化,静态问题动态化,在解决那些教师难以表述而学生又难以理解的问题上,动态展示变化的过程,突破教学难点。

在工艺与设计课的教学中,有关工艺制作的程序、步骤和方法复杂、严谨,技法的要点、难点较多,教师要做大量的示范。教师要想利用课堂时间演示一个完整制作过程,不是一件容易的事,如绘制“简单图案”教学,仅其中的上色环节,就不是一遍两遍能完成的,非常耽误时间,而且没有办法让全班学生都能看清楚。在传统教学中,很多教师往往只好口头教授,稍作演示,这样的教学,学生往往不能掌握技法上的难点。利用计算机辅助教学,我们可以将图案制作的完整程序制作成图文并茂的幻灯片进行放映,从绘制草图、拷贝、涂色,到最后调整、修改,色彩转换,都非常方便、快捷,整个过程展示清晰明了又独特,学生边看放映边学习,印象深刻,教学难点轻松解决。

3、通过整合培养美术欣赏能力

美术欣赏能力的培养历来是美术教育教学的难点。把艺术作品不同元素间的相互关系在大脑中形成反射,调动学生的多种感觉器官,利用知识经验进行综合加工,是形成审美情感和审美理解的过程。使用计算机,可以容易地将多种媒体融合在一起,并方便地展示给学生,突破美术欣赏能力的培养教学中的难点问题。

在计算机辅助的美术欣赏课中,把音乐和美术、电影与美术有机地结合起来,可以图文并茂、声色俱全的表现深刻主题,能充分有效的培养学生的审美理解力、创造力。如欣赏《格尔尼卡》时,如果只看课本中的小幅图片,学生会因为对作品内容及产生背景缺乏一定的认识,而印象不深,难以产生共鸣,影响了学生对美术作品的审美欣赏。计算机辅助教学可以将画子投影到大屏幕上,用声情并茂的语言稍加提示作品背景、内容,通过鼠标指针,指点画中细节,引导学生观察,同时播放合适的背景音乐……这时学生就开始自觉地“设身处地”,进入某种情景,产生审美同情。

第5篇:计算机视觉的优点范文

[关键词]美术教学;计算机辅助教学;优越性

在科学技术发展的今天,集声、光、电等为一体的多媒体技术,以其高效、快捷、全面传授知识,保存、收集资料相互交流等优势,极大促进了整个教学的改革和发展。其中以形象直观的美术教学最为受益。计算机辅助教学,因其能激发学生的学习兴趣、促使学生主动学习、提高课堂教学效率等诸多优点,而成为现代课堂教学中最常用的教学手段之一,广泛应用在中小学各学科的教学中,美术教学也不例外。使用计算机辅助教学,能更好地突出教学重点,突破教学难点。特别是在突破传统教学的诸多难点上,计算机可以发挥无可比拟的优越性。中小学美术教学中的难点,是在教材的教授过程中,学生对知识的难以理解之点,技法的难以掌握之处。以下举例介绍计算机辅助教学解决中小学美术教学难点的一些应用。

一、获得独特的视觉效果

使用计算机辅助教学可以充分利用计算机的特点,根据教学需要,获得独特的数码虚拟视觉效果,协助教师突破教学中的难点。美术欣赏课有很强的直观性,使用计算机辅助教学,通过数码投影仪,就可以将作品清楚地放大展示,让学生在欣赏课上能够真正地“欣赏”。以七年级第十四册《现代生活的视觉语言》一课为例,通过欣赏不同年代、不同形式的标志,使学生开阔眼界,丰富知识。标志很小,教师拿在手中展示,学生想要看清楚都很费劲,更别说欣赏了,对教师而言,同样也不便于知识的讲解。而若通过计算机和数码投影仪,将各种标志投影成2 米见方的影像,就可以让课堂上的每个学生都能看得清楚,达到最佳的审美感受。同时还可以放大局部进行有针对性地观察,教师结合知识重点、难点进行分析讲解。由此,视觉的传达与知识的传授相得益彰,让学生在审美体验中学习和提高。

二、动态展示变化的过程

集文字、图像、图形、声音、动画和视频为一体。教师可以根据教学需求,通过计算机表现许多传统教学技术不能表现的事物和现象,如演示形象生动的动画,声情并茂的有声画面,色彩丰富的教学图片等。CAI 可以使抽象问题形象化,静态问题动态化,在解决那些教师难以表述而学生又难以理解的问题上,动态展示变化的过程,突破教学难点。

在工艺与设计课的教学中,有关工艺制作的程序、步骤和方法复杂、严谨,技法的要点、难点较多,教师要做大量的示范。教师要想利用课堂时间演示一个完整制作过程,不是一件容易的事,如绘制“简单图案”教学,仅其中的上色环节,就不是一遍两遍能完成的,非常耽误时间,而且没有办法让全班学生都能看清楚。在传统教学中,很多教师往往只好口头教授,稍作演示,这样的教学,学生往往不能掌握技法上的难点。利用计算机辅助教学,我们可以将图案制作的完整程序制作成图文并茂的幻灯片进行放映,从绘制草图、拷贝、涂色,到最后调整、修改,色彩转换,都非常方便、快捷,整个过程展示清晰明了又独特,学生边看放映边学习,印象深刻,教学难点轻松解决。

三、通过整合培养美术欣赏能力

美术欣赏能力的培养历来是美术教育教学的难点。把艺术作品不同元素间的相互关系在大脑中形成反射,调动学生的多种感觉器官,利用知识经验进行综合加工,是形成审美情感和审美理解的过程。使用计算机,可以容易地将多种媒体融合在一起,并方便地展示给学生,突破美术欣赏能力的培养教学中的难点问题。

第6篇:计算机视觉的优点范文

在科学技术发展的今天,集声、光、电等为一体的多媒体技术,以其高效、快捷、全面传授知识,保存、收集资料相互交流等优势,极大促进了整个教学的改革和发展。其中以形象直观的美术教学最为受益。计算机辅助教学,因其能激发学生的学习兴趣、促使学生主动学习、提高课堂教学效率等诸多优点,而成为现代课堂教学中最常用的教学手段之一,广泛应用在中小学各学科的教学中,美术教学也不例外。使用计算机辅助教学,能更好地突出教学重点,突破教学难点。

一、获得独特的视觉效果

使用计算机辅助教学可以充分利用计算机的特点,根据教学需要,获得独特的数码虚拟视觉效果,协助教师突破教学中的难点。美术欣赏课有很强的直观性,使用计算机辅助教学,通过数码投影仪,就可以将作品清楚地放大展示,让学生在欣赏课上能够真正地“欣赏”。

欣赏三维造型艺术时,计算机辅助教学不仅可以用通常的视觉方式,让学生欣赏到物体在某一视觉角度的造型或其内部构造,而且可以做出“动感显示”效果,让三维物体旋转起来,欣赏到它的各个侧面,让学生体会到物体的立体感、空间感。

二、动态展示变化的过程

计算机具有强大的多媒体功能,集文字、图像、图形、声音、动画和视频为一体。教师可以根据教学需求,通过计算机表现许多传统教学技术不能表现的事物和现象,如演示形象生动的动画等。CAI可以使抽象问题形象化,静态问题动态化,在解决那些教师难以表述而学生又难以理解的问题上,动态展示变化的过程,突破教学难点。

工艺与设计课的教学中,有关工艺制作的程序、步骤和方法复杂、严谨,技法的要点、难点较多,教师要做大量的示范。教师要想利用课堂时间演示一个完整制作过程,不是一件容易的事,在传统教学中,很多教师往往只好口头教授,稍作演示,这样的教学,学生往往不能掌握技法上的难点。

三、通过整合培养美术欣赏能力

第7篇:计算机视觉的优点范文

关键词:计算机智能视频监控;运动目标检测方法;目标跟踪方法

中图分类号:TP311 文献标识码:A 文章编号:1674-7712 (2012) 10-0104-01

随着人工智能技术日新月异的发展,基于人工智能的计算机视觉技术也得到了广泛的推广和应用,成为计算机智能领域一个重要的发展方向。到目前为止,计算机视觉技术已经过20余年的发展,其在社会人文,军事技术及工业生产领域得到了广泛的应用,并以其独具特色的技术优势逐渐形成了一门具有一定先进理论支撑的独立学科。其中,著名学者Marr提出的视觉计算理论已成为计算机智能视频监控领域的主导思想,为大多数该领域内的研究人员所接受。从广义上讲,计算机视觉技术的实质就是实现对在复杂环境中运动物体的几何尺寸、形状及相关运动状态的识别和认知,即把实际空间中的三维对象转换为计算机视觉系统识别的二维图像。近年来,计算机视觉技术以其迅猛的发展态势及成熟的应用技术成为了业界的新宠,并得到了广泛的应用,取得了瞩目的成绩。

一、运动目标检测方法分析

(一)运动目标在静止背景条件下的检测分析

1.差分检测法

将同一背景不同时刻两幅图像进行比较,可以反映出一个运动物体在此背景下运动的结果,比较简单的一种方法是将两图像做“差分”或“相减”运算,从相减后的图像中,很容易发现运动物体的信息。在相减后的图像中,灰度不发生变化的部分被减掉,则前区为正,后区为负,其他部分为零。由于减出的部分可以大致确定运动目标在图像上的位置,使用相关法时就可以缩小搜索范围。

2.自适应运动检测方法

当两帧图像的背景图像起伏较大时,简单的差分法难以得到满意的解。此时可以考虑用自适应背景对消的方法,该方法可以在低信杂比的情况下压制背景杂波和噪声,检测出非稳态图像信息。在背景杂波较大时,常用的门限分割不能分出这种运动目标。在图像序列中,每一个像素点的灰度值都是这一点所对应传感器的输出信号值与噪声值的叠加,因此,如何克服噪声的影响确定一个最佳门限将目标与背景分离,就成为弱小目标检测的一个重要环节。

(二)目标在运动背景条件下的检测方法分析

块匹配法是目标在运动背景条件下的主要检测方法。基于块的运动分析在图像运动估计和其他图像处理和分析中得到了广泛的应用,比如说在数字视频压缩技术中,国际标准MPEG1-2采用了基于块的运动分析和补偿算法。块运动估计与光流计算不同,它无需计算每一个像素的运动,而只是计算由若干像素组成的像素块的运动,对于许多图像分析和估计应用来说,块运动分析是一种很好的近似。这里主要介绍块匹配方法。块匹配方法实质上是在图像序列中做一种相邻帧间的位置对应人物。它首先选取一个图像块,然后假设块内的所有像素做相同的运动,以此来跟踪相邻帧间的对应位置。各种块匹配算法的差异主要体现在:匹配准则、搜索策略及块尺寸选择方法上。

1.匹配准则

典型的匹配准则有:最大互相关准则、最小均方差准则、最小平均绝对值差准则、最大匹配像素数量准则等。

2.搜索策略

为了求得最佳位移估计,可以计算所有可能的位移矢量对应的匹配误差,然后选择最小匹配误差对应的矢量就是最佳位移估计值。因此,人们提出了各种快速搜索策略。这种策略的最大优点是可以找到全局最优值,但十分浪费时间。因此,人们提出了各种快速搜索策略。尽管快速搜索策略得到的可能是局部最优值,但由于其快速计算的实用性,在实际中得到了广泛的应用。下面讨论两种快速搜索方法:二维对数及三步搜索法。

二维对数搜索法开创了快速搜索算法的先例,分多个阶段搜索,逐渐缩小搜索范围,直到不能再小而结束。其基本思想是从当前像素点开始,以十字形分布的5个点构成每次搜索的点群,通过快速搜索跟踪最小误差MBD点。

三步搜索法与二位对数法类似,由于简单、健壮、性能良好等特点,为人们所重视。例如其最大搜索长度为7,搜索精度取一个像素,则步长为4、2、1,只需三步即可满足要求,因此而得名三步法。其基本思想是采用一种由粗到细的搜索模式,从原点开始,按一定步长取周围8个点构成每次搜索的点群,然后进行匹配计算,跟踪最小块误差MBD点。

三、运动目标跟踪方法

成像跟踪系统经过图像的预处理、图像的分割识别等一系列信息处理,最终实现对目标位置的实时精确测量。跟踪策略基本上可分为两大类:波门跟踪和相关跟踪。

(一)波门跟踪法分析

参考被跟踪目标外观的实际尺寸形态,事先确定好跟踪窗口就是我们通常所定义的“波门”的概念。与传统的图像处理方法不同,采用波门跟踪法进行图像的分析和处理,其原始状态的图像数据仅仅限于波门内的数据,这样系统一旦捕捉到目标,不仅可以避免传统技术对整幅图像处理过程的耗时缺点,而且这种跟踪技术应用和操作更为简单,跟踪及成像效果也能够得到切实的保障。

(二)相关跟踪法分析

当被跟踪的目标物体出现运动、姿态的调整或由于自然条件等因素造成了背景的杂波干扰时,目标图像的分割及提取工作由于目标矩心及形心的不确定将难于进行。这种情况下,就可以采用相关跟踪的方式进行处理。这种基于图像匹配为基础的相关跟踪技术是以图像相识性度量为基础,获取现场图像中实时的最接近目标图像值的一种跟踪方式。由于分析及处理过程中,不需对用于分割及提取的特征值进行处理,因而可以应用于对图像数据的原始资料的处理方面,这种方法不仅可以使图像的信息得以全部的保留,而且适合众多复杂的环境及场景,是一种操作简单,结果精确的测量方法。

四、结语

近年来,各行各业对视频监控的需求不断升温,但已有的视频监控产品不能满足日益增长的需要。因此,计算机视觉和应用研究学者适时提出新一代监控—视频智能监控。它是目前国内外计算机视觉研究领域热点问题之一。因而,在生产实践中,不断加强对其的分析和研究具有非常重要的现实意义。

参考文献:

第8篇:计算机视觉的优点范文

1引言

随着移动通信技术的迅猛发展,人们通过移动终端访问网页的活动日渐频繁。然而,移动终端屏幕尺寸的限制往往造成Web页面无法正常显示,给用户带来了很大的困扰。为了解决这个问题,早在20世纪90年代,研究人员便开始研究网页自适应呈现技术,提出了若干算法。这些算法可归纳为3类,即网页重构、网页转码、网页分割。其中,网页分割是实现网页自适应呈现的主流技术之一。它首先将网页分割成若干个语义相关的内容段(也称为内容块);然后在内容服务过程中,服务器根据移动终端特征,选择合适的内容段并推送给用户,以确保网页内容在移动终端上得以正常显示。网页分割技术具有两个优点:一方面,它不需要占用大量的计算资源;另一方面,用户也不需要反复拖动滚动栏查看网页内容,使网页内容的服务质量得以保证。近年来,关于网页分割技术的研究受到了广泛关注,并且取得了丰富的研究成果。其中经典算法是Cai等研究人员提出的基于视觉的网页分割技术(Vision-basedPageSegmenta-tionAlgorithm,VIPS)。VIPS根据人的视觉特点,总结出一些网页分割的规则,然后基于这些规则实现网页分割。此后,许多研究者在该方法的基础上提出了许多改进的网页分割技术,但基于规则的思想没有本质变化。目前,基于视觉的网页分割技术主要存在两方面问题:其一,网页分割结果过碎,不利于网页重构;其二,分割规则的总结需要人工参与,规则的好坏也直接影响网页分割效果。因此,如何划分网页分割的粒度,如何能减少分割过程中人工参与,从而降低主观因素影响,均是需要进一步研究的问题。本文将网页分割转化为图的最优划分问题,提出一种新颖的网页最优分割算法(Vision-basedWebOptimalSegmen-tation,VWOS)。VWOS算法首先基于人的视觉特点设计内容相似度计算模型,然后利用网页结构特征和内容相似度模型,将网页构造为加权无向连通图,并将网页分割转化为图的最优划分问题,最后基于Kruskal算法求解图的最优划分问题,实现网页最优分割。VWOS算法是一种自动算法,不需要人工参与。实验分析表明,该算法能够有效地对网页进行分割,分割效果和算法性能优于VIPS算法。

2相关研究

网页是一类特殊的文本文件,它具有内容特征、结构特征、布局特征和视觉特征。针对上述4种特征,网页分割技术可以分为4种类型:基于内容特征的分割技术、基于结构特征的分割技术、基于布局特征的分割技术和基于视觉特征的分割技术。基于内容特征的网页分割技术主要是基于网页标签。20世纪90年代末的手机浏览器不支持CSS层叠样式,也不支持JavaScript,只能访问简单的静态网页。因此,当时的学者只需基于标签的类型进行分割,即可达到很好的效果。YanleiDiao等人提出具有自学习功能的Web查询处理系统[1],利用有效标签类型(如〈p〉、〈table〉、〈ul〉、〈h1〉~〈h6〉)进行网页分割;Wai-chingWong提出标签检测算法来检测具有同类型信息的相似标签,并定义标签类型进行网页分割;EijaKaasinen与OrkutBuyukkokten仅仅利用像〈p〉〈ta-ble〉〈ul〉这样的简单标签进行Web网页分割。基于结构特征的网页分割技术采用了DOM(DocumentObjectModel,DOM)技术,将网页表示成DOM树结构,然后根据各内容块在DOM树中的位置对网页进行分割。文献均采用的是基于DOM树的分割技术,RichardRomero[8]在DOM树的基础上进行聚类分析,实现网页分割。基于布局特征的网页分割技术主要包括基于位置的网页分割技术与基于模板的网页分割技术两种。GenHattori提出的基于距离的网页分割技术,利用标签的相对位置与层级关系计算内容块的距离,以此对网页进行分割。然而HTML中某些特殊标签具有布局作用,降低了分割的准确率。通过对HTML标签的研究与分析,GenHattori于2007年提出改进技术:混合分割技术。混合分割技术将〈div〉与〈table〉作为布局信息,进行初步分割,之后将标签间的距离作为内容块的距离做二次分割。基于模板的网页分割技术的主要思想是分割前定义好各类模板,通过将欲分割的网页或内容块与模板匹配来进行分割。YuChen将网页分成上、下、左、右和中间5个部分,之后根据这5个部分的特征将网页的内容提取后纳入到定义好的特征模版中,从而实现网页分割。这种技术适合于结构标准的网页,对于其他结构的网页则无法正确分割。文献将网页归类于布局模板,之后依据网页布局(此处考虑的是标签形成的布局,而非样式信息形成的布局)与标题块进行网页分割。基于视觉特征的网页分割技术的原理是标签本身携带内容显示信息,根据人眼的视觉特征,利用这些显示信息实现网页的内容分割。DengCai提出了一种基于视觉特征的网页分割技术(Vision-basedPageSegmentationAlgorithm,VIPS),该算法具有良好的网页分割效果。VIPS存在的问题在于需要人工不断地去总结和调整分割规则,而且当新规则产生后,将影响以前的分割效果。基于VIPS算法,国内外学者提出了一系列的改进技术[14-18],这些技术在一定程度上优化了VIPS,但上述的本质问题却没有解决。此外,这些技术均没有考虑CSS样式信息对视觉特征的影响。

3VWOS算法设计

根据网页的标签,可以将网页划分为许多语义完整的原子内容块,这些内容块是网页内容的最小组成单元。基于网页视觉特征定义两个原子内容块的相似度计算公式,并利用该公式构造原子内容块相似度矩阵。因此,网页可以视为由原子内容块为顶点、相似关系为边、相似度为权的加权无向连通图,网页分割就转化为图的最优划分问题。

3.1网页最优分割模型为便于表述网页最优分割模型,对其中包含的重要概念做如下定义。通过解析网页得到内容块,并利用内容块相似度公式计算内容块两两之间相似度,得到相似度矩阵。在此前提下,网页可以构造为加权无向连通图。因此,网页分割转化为图的最优划分问题,其最优化模型如式(1)所示。式(1)的最优化模型具有3个典型性质:最优子结构、重叠子问题与贪心选择性质。最优子结构指问题的最优解包含子问题的最优解。如果上述问题的最优解包含了原子内容块n,那么其余原子内容块一定构成子问题n-1个原子内容块在组阈值为St-Sn时的最优解。如果最优解不包含原子内容块n,那么其余原子内容块一定构成子问题n-1个原子内容块在组阈值为St时的最优解。重叠子问题指用递归算法自顶而下解决上述问题时,每次产生的子问题并不总是新问题,有些子问题被反复计算了多次。贪心选择性质指所求问题的整体最优解可以通过一系列局部最优解的选择来达到。若所有原子内容块构成的集合为V,组内已确定的原子内容块构成的集合为U,s[u][v]表示原子内容块u、v间的相似度。u∈U,v∈V-U,由于U中所有原子内容块构成一棵相似度最大的生成树,根据MST性质,V的所有相似度最大的生成树中一定存在一棵包含边(u,v)。

3.2VWOS算法网页最优分割算法VWOS分为4个步骤:第一,根据手机分辨率信息,确定网页分割阈值St;第二,建立原子内容块池Pc与相似度池Ps,相似度按值从大到小排序;第三,构建网页加权无向连通图G(V,E);第四,求解图G(V,E)最优划分问题。(1)网页分割阈值确定不同手机的分辨率不同,所能呈现的信息量亦不同。因此网页分割时,需要设置不同的阈值,以达到在不影响正常显示与用户体验的情况下,子页所呈现的信息量最大化。网页分割算法采用像素面积确定分割阈值St。使用诺基亚5800W手机,随机浏览100个手机版网页,统计分析知,平均每个网页需要3.51屏显示;随机抽取100位大学生手机网民,对“手机版网页出现几屏显示时,会心生埋怨心理”问题进行调查,分析发现其平均值为2.87。考虑到用户体验的重要性,对上述两个结果以比例1:2进行加权求均值得3.08。因此,可确定最适合手机显示的网页大小为手机屏幕的3倍。由于VWOS算法所用的网页分割算法的特殊性,有时分割形成的子页结果为所设阈值的2倍。对此,将网页分割阈值St设为1.5屏,即St=1.5×水平分辨率×垂直分辨率。(2)原子内容块池Pc与相似度池Ps的建立为了更有效地实现网页分割,需要建立原子内容块池Pc与相似度池Ps。Pc中存放原子内容块算法获得的所有内容块。原子内容块相似度计算及后期建立连通分支时均从Pc中获取所需的内容块。Ps中存放采用基于网页视觉特征的相似度公式得到的相似度值,并按值从大到小的顺序排列。内容相似度基于网页视觉特征,在此将网页视觉特征定义为6维向量,根据向量中维度的不同度量属性,采用不同的计算公式计算各维度相似度值,最后用加权求和的方式计算出最终的内容块相似度值[19]。Pc存放的内容块类型为Perfect-Node,而Ps存放的相似度以本文自定义的Similarity类型标识,其类图如图1所示。对Ps而言,由于构建连通分支时,以相似度值从大到小的顺序连通各分支,因此,Ps中的Similar-ity数据是按值递减的有序队列。1Similarity类(3)连通分支构建Pc中含有网页所有的原子内容块,Ps中含有两原子内容块间的相似度值,并按值从大到小排列。对Pc与Ps采用如下算法构建连通分支,以确保每个分支的相似度权值最大,且每个分支中所有顶点的像素面积和Sk均小于分割阈值St。这样便实现了网页分割所需的每个连通分支均可转换为各个子页,这些子页不仅可在手机浏览器中正常显示,而且具有较好的用户体验。连通分支构建算法如图2所示。1)将Pc中n个内容块看成n个孤立的连通分支,并建立关联池cr。2)计算各连通分支像素面积和Sk,并与St比较:如果Sk≥St或所有边都被查看过,则将连通分支中的顶点从Pc中取出存入关联池cr中;如果Sk<St,按下述方法连接两个不同的连通分支:设查看到第s条边,若该边两端点分别是当前两个不同的连通分支T1和T2中的顶点,则用该边将T1和T2连成一个连通分支;若该边两端点在当前的同一个连通分支中,直接查看第s+1条边。3)如果所有边都被查看过或Pc中已经没有原子内容块,则连通分支构建算法结束,否则转步骤2)。需要特别指出的是,若以是否含有孤立的连通分支或查看边数是否达到n+1作为结束算法的条件,虽然可以大幅度减少算法循环次数,但是,却不能保证最后生成的连通分支不能再合并。而仅仅以判断所有边是否被查看过作为结束算法的条件,虽然可以保证Sk在小于St的情况下最大化,然而因需要过多的循环次数导致时间复杂度过大,从而影响VWOS算法的性能。通过分析与测试发现,多数情况下,各连通分支均不能再合并时,有很多边没有被查看,对此,连通分支构建算法采用“所有边都被查看过或Pc中已经没有原子内容块”作为算法结束条件,以达到在满足Sk最大化的同时性能最大化。(4)求解网页最优分割问题网页最优分割模型如式(1)所示,基于模型的最优子结构和贪心选择性质,可采用贪心策略求解该模型。因为,加权无向连通图G(V,E)可构造为一棵生成树,使生成树上各边权值最大,于是网页分割可变为在特定阈值St条件下构造子生成树的过程,每个子生成树均满足特定阈值St。采用最优化理论中的Prim算法与Kruskal算法所需的时间复杂度分别为O(n2)与O(eloge),其中e为图的边数。当e=Ω(n2)时,O(n2)<O(eloge),当e=O(n2)时,O(n2)<O(eloge)。因为网页对应的加权无向连通图G(V,E)是一张完全图,即e=n(n-1)/2=O(n2),所以用Kruskal算法比用上述其它算法时间复杂度低。因此,本文采用Kruskal算法实现网页最优分割问题求解。

4实验与分析

为检验VWOS算法的执行效果和性能,设计了一组网页分割对比实验。实验基于Web服务设计,通过移动终端访问网页。将VWOS算法和VIPS算法部署在服务器,以国家精品课程站点随机选取的100个网页为对象,移动终端采用分辨率为360×640像素的Android2.3手机模拟器,分割阈值St=1.5×360×640=3.456×e5。采用3个评价指标:平均分割块数、语义完整度和平均执行时间。其中语义完整度定义见式(2)。通过网页在移动终端的呈现结果,比较VWOS算法与VIPS算法在3个指标上的表现,评价算法效果和性能。

结果与分析本节以具体的2个网页呈现的结果为例,比较两种算法分割效果和性能,并分析其中的原因。结合专业背景,选取的网页定为北京师范大学的国家精品教育技术学导论与南京师范大学国家精品课程教育社会学。图3(a)为北京师范大学的国家精品教育技术学导论经VWOS算法分割的效果。VWOS算法将该网页分割为两个子页,如图3(b)与图3(c)所示,图3(b)为主页,图3(c)为子页。从图中可以发现,VWOS算法分割该页面后得到的两个子页语义完整且适合手机浏览器显示,具有较好的用户体验。图4为教育技术导论网页采用VIPS算法的分割结果。

VIPS将该网页分割为6个子页。其中只有表格子页的像素面积与分割阈值接近,而其他5个子页尺寸均远小于阈值。VIPS算法之所以将网页分割得过碎,主要因为其以DOM树为基础,对每个内容块用DoC(DegreeofCoherence)表示紧密程度。按照VIPS的规则,DoC在DOM树中呈现自顶而下逐渐增大的规律。而VIPS采用自顶而下的方式分割,因此当DOM树底层的内容块符合分割阈值时,上层内容块因DoC小于PDoC(PermittedDegreeofCoherence)而被过度分割。VWOS算法基于最优化理论,将网页分割看作分组最优化问题,并设计网页分割算法以自底而上的方式对网页进行分割,有效地避免了分割过碎问题。由此可以看出在分割后形成子页数方面,VWOS算法较VIPS算法内容块语义更完整,也更适合移动设备显示。图5为南京师范大学国家精品课程教育社会学分别经VWOS与VIPS分割的效果。采用VWOS算法进行分割后形成两个子页,其中图5(b)所示子页为原网页右下角部分。该部分像素面积略大于分割阈值St,按照VWOS算法设计的网页分割算法,该部分会作为一个完整子页存在。采用VIPS算法,将页面分割为3个子页,如图5(c)所示,其中黑色方框内的部分为分割后保留下的内容块。观察图5(c)很容易发现丢失了部分内容块。分析该网页的代码可发现,丢失的部分均为样式信息,该部分的样式信息存储在CSS文件中,而非HTML标签的style属性中。由此,再一次证明了由于“数据内容-样式信息”的分离,致使VIPS分割效果无法满足手机用户需求的假设,也再一次说明了网页分割预处理算法的必要性。

VWOS算法充分考虑了〈link〉、〈style〉与HTML标签style属性中的样式信息,并将样式信息与数据内容融合,以此保证内容块视觉特征的全面性与精确度。因此可以看出,在分割后形成的内容块方面,VWOS算法得到的内容块具有语义完整的特点,而VIPS算法分割过程中,会造成内容块视觉特征的丢失,甚至会造成部分内容块的丢失。此外观察图5(b)可以发现,分割形成的子页的像素面积比手机尺寸大,这主要因为该部分采用〈table〉标签进行布局,而VWOS算法并未对〈table〉标签的宽高信息进行处理。实验采用VWOS算法和VIPS算法共对100个精品课程站点网页进行网页分割,并在3个性能指标上进行统计对比,结果如表1所列。通过上述实验,初步证明VWOS算法在内容块语义完整性和网页适应性方面,比VIPS算法具有更好的性能。具体而言,VWOS算法比VIPS算法具有以下4点优势:第一,VWOS算法不需要人工参与,是一种网页分割自动处理方法;第二,在同样的分割阈值条件下,VWOS算法生成的子页数少,因此用户在各子页中遍历浏览时,不易迷航;第三,VWOS算法生成的每个子页的像素面积SP均在[St,2St)区域中,没有过度分割的子页;第四,VWOS算法充分利用视觉特征表示内容块的特征,分割得到的每个内容块均具有高度的语义完整性。结束语网页分割技术被广泛应用于网页信息获取和网页自适应呈现等领域。目前,经典的网页分割算法仍存在需要人工参与和分割过碎的问题。针对这些问题,综合视觉特征和网页结构,将网页构造为加权无向连通图,并将网页分割转化为图的最优划分问题,最后基于经典的最优化算法,结合网页分割的过程,提出了一种基于视觉特征的网页最优分割算法VWOS。实验证明,VWOS算法在语义完整性和网页适应性方面,性能优于经典分割算法VIPS。与VIPS算法相比,VWOS算法有两个优点。其一是网页分割结果没有过多的内容碎片,较好地保留了内容块的语义完整性;其二是它属于自动算法,不需要人工参与。当然,VWOS算法仍存在一些不足之处,集中表现在由于网页样式采用技术不同对构造网页无向连通图G影响较大,因此该算法的鲁棒性存在不足。

第9篇:计算机视觉的优点范文

关键词:美术教学;计算机辅助教学;优越性

中图分类号:G632 文献标识码:B 文章编号:1002-7661(2015)07-330-01

新课改已经在各地展开了,各学科也进行着积极的探讨,作为高中美术学科,也开展着积极的探索。现代信息技术的发展引起了社会生活各个领域的巨大变化,也引起了教学的重大改革。计算机被广泛应用于教学之中。高中美术教学也不例外。使用计算机辅助教学,能更好地突出教学重点,突破教学难点。特别是在突破传统教学的诸多难点上,计算机可以发挥无可比拟的优越性。中小学美术教学中的难点,是在教材的教授过程中,学生对知识的难以理解之点,技法的难以掌握之处。以下举例介绍计算机辅助教学解决美术教学难点的一些应用。

一、独特的视觉效果的获得

使用计算机辅助教学可以充分利用计算机的特点,根据教学需要,获得独特的数码虚拟视觉效果,协助教师突破教学中的难点。美术欣赏课有很强的直观性,使用计算机辅助教学,通过数码投影仪,就可以将作品清楚地放大展示,让学生在欣赏课上能够真正地“欣赏”。如:《现代生活的视觉语言》一课为例,通过欣赏不同年代、不同形式的标志,使学生开阔眼界,丰富知识。标志很小,教师拿在手中展示,学生想要看清楚都很费劲,更别说欣赏了,对教师而言,同样也不便于知识的讲解。而若通过计算机和数码投影仪,将各种标志投影成2 米见方的影像,就可以让课堂上的每个学生都能看得清楚,达到最佳的审美感受。同时还可以放大局部进行有针对性地观察,教师结合知识重点、难点进行分析讲解。由此,视觉的传达与知识的传授相得益彰,让学生在审美体验中学习和提高。

欣赏三维造型艺术时,计算机辅助教学不仅可以用通常的视觉方式,让学生欣赏到物体在某一视觉角度的造型或其内部构造,而且可以做出“动感显示”效果,让三维物体旋转起来,欣赏到它的各个侧面,让学生体会到物体的立体感、空间感。利用计算机辅助教学,产生真实新奇的视觉效果,独特的感染力,将使学生对这一课留下难忘的印象。

二、动态展示变化的过程

计算机具有强大的多媒体功能,集文字、图像、图形、声音、动画和视频为一体。教师可以根据教学需求,通过计算机表现许多传统教学技术不能表现的事物和现象,如演示形象生动的动画,声情并茂的有声画面,色彩丰富的教学图片等。CAI 可以使抽象问题形象化,静态问题动态化,在解决那些教师难以表述而学生又难以理解的问题上,动态展示变化的过程,突破教学难点。如:在工艺与设计课的教学中,有关工艺制作的程序、步骤和方法复杂、严谨,技法的要点、难点较多,教师要做大量的示范。教师要想利用课堂时间演示一个完整制作过程,不是一件容易的事,如绘制“简单图案”教学,仅其中的上色环节,就不是一遍两遍能完成的,非常耽误时间,而且没有办法让全班学生都能看清楚。

三、有机整合,提高美术欣赏能力

美术欣赏能力的培养历来是美术教育教学的难点。把艺术作品不同元素间的相互关系在大脑中形成反射,调动学生的多种感觉器官,利用知识经验进行综合加工,是形成审美情感和审美理解的过程。使用计算机,可以容易地将多种媒体融合在一起,并方便地展示给学生,突破美术欣赏能力的培养教学中的难点问题。

在计算机辅助的美术欣赏课中,把音乐和美术、电影与美术有机地结合起来,可以图文并茂、声色俱全的表现深刻主题,能充分有效的培养学生的审美理解力、创造力。能有效地提高学生的审美素养以及美的感受力和理解力,但时间一长,就会造成视觉疲劳。所以在教学中,我充分利用了多媒体进行教学,用更加丰富多彩的教学形式优化了欣赏课的教学结构,使学生在直观、具体、生动、有趣的课堂气氛中,学会了更多的美术知识。当欣赏一些作品时,学生对单一的听老师讲解感到枯燥、单调,使得学生在欣赏美术作品时显得很被动,学生的注意力也容易分散,老师的教学也达不到很好的效果,而充满美感的媒体音乐、文字、图片、动画、影像等多媒体综合信息,则能自然地调动起学生欣赏美术作品的积极性、主动性,学生会在老师的引导下主动去感受美术的艺术美和形式美,学生在欣赏优秀作品和美妙音乐的同时,脑海里产生种种生动的想象,好像身临其境一般,并激发起了强烈的创作欲望。在美术欣赏教学中,使用多媒体辅助教学,不仅能提高学生对美术的兴趣,而且也扩展了学生的想象和思维空间。因此,在美术欣赏教学中,我巧妙的运用多媒体进行教学,取得许多意想不到的效果。特别是高中生,他们对知识的需求空间很大,媒体教学能充分发挥他们的主体作用,调动他们的学习积极性,引导他们主动投入欣赏活动中,创造一个良好的艺术氛围。如《中国民间美术》一课,把民间美术作品、各地方风俗、服装饮食等做成课件,让学生充分了解中国的民族文化、地域风俗,通过多媒体使美术情感与艺术形象完美的结合了起来。有了对美术的理解,再结合生活中的素材,学生对美术作品的创作就自然明白了。

四、多元化文化的教育渗透

美术的多元化不仅在于它的表现形式、创作手法,它本身就有着丰富的文化内涵与背景,许多文化都渗透于美术中。就拿建筑来说吧,中国古代建筑艺术由于地域分布、建筑功能的不同而呈现不同的艺术风格,近现代建筑因为时代的进步、审美时尚的变迁,建筑风格向着更加多元化、个性化发展。在教学中教师用语言、图片等方式传授给学生是远远不够的,也达不到目的,而运用多媒体辅助教学,教师可以把所需要的资料做成课件,让学生去感受、去体会,这样既真实又自然,学生不仅学会了体会作品的美感,同时也了解了建筑的精神内涵。学生的知识面也得到了相应的扩展,而美术也真正是作为一种文化让学生接受。

总之,美术是造型艺术,美术教学离不开大量的直观教学,计算机多媒体辅助教学提供了丰富多样的教学内容和手段,大大提高了教学效率,深得学生的喜爱。我们广大的美术教师要充分合理有效地运用计算机多媒体教学辅助系统,大力开发美术教育软件。