公务员期刊网 论文中心 正文

目标检测分类系统设计探究

目标检测分类系统设计探究

摘要:随着科技水平的不断发展,机器代替人进行简单而繁琐的工作是发展趋势。综合考虑能够适用于各种不同场面的分类工作的潜力,本文设计了一种能够通过摄像头与机械臂对图像物品进行捕捉、抓取和分类的一体式智能交互机器人。

关键词:视觉跟踪;图像识别;物品分类;深度学习;YOLOv3

1引言

目前,目标检测算法主要包括传统目标检测技术和深度学习目标检测技术。传统的识别技术主要采用滑动窗口实现图片内目标搜索,检测精度较低,具有较差的鲁棒性。YOLOv3是一种快速、准确的深度学习目标检测技术[1-2],在检测速度与检测精度方面具有较好的综合性能,因此被广泛应用于近景目标检测。本文提出一种基于树莓派的智能交互机器人控制系统设计,通过树莓派搭载摄像头构成机器人的视觉交互系统,利用YOLOv3进行目标识别,将深度学习算法与智能交互机器人技术相结合,具有一定的创新性和研究价值。

2系统整体设计

2.1系统主体结构

系统主体结构包括以下部分:树莓派摄像头、树莓派、STM32系统板、六舵机械臂、稳压模块、驱动模块、电机、车模。

2.2工作原理

系统的整体控制结构如图1所示。树莓派通过YOLOv3识别摄像头读取的图片,识别物体所在位置并通过串口发送给STM32。STM32单片机再控制小车进行运动,通过多次的识别及运动后,当物体所在位置在机械臂可以捕捉的范围内时,小车停止运动,控制机械臂对其进行捕捉。捕捉成功后,机械臂再把物体摆放在给定的分类区,完成一次捕捉分类任务。

3系统结构设计

智能交互机器人由车体、直流电机与驱动模块、控制与信息处理装置、机械臂等部分组成,机械臂采用舵机驱动,机械结构如图2所示。机器人的总体结构设计目标如下:(1)在无人为外界因素干预的情况下,智能交互机器人能高效地自主运行。(2)智能交互机器人的机械结构和控制系统采用模块化设计,便于拆卸、修理和维护。(3)机械臂的设计采用串联结构,不同关节不会相互影响,可以完成较好的传动精度和传动稳定的设计要求。大扭矩舵机保证转动精度,单舵机控制单关节,使得机械臂动作简单,控制容易。(4)通过PWM同时驱动四台直流电机可对电机进行直接控制。输入信号采用光耦合进行隔离,且具有欠压保护功能。同时设计了静电泄放回路,充分满足电机驱动要求。(5)主控采用STM32F103微处理和树莓派4B,可以满足系统的控制需要。(6)车体采用铝制底盘,绝缘性较好,重心低,载重能力强,保证智能交互机器人机械结构的小巧轻便以及在运行时性能的稳定。

4系统软件设计

4.1软件流程

程序流程图如图3所示。系统软件设计采用模块化程序设计方法,包括系统初始化程序、摄像头识别程序、机械臂控制程序和灰度循迹程序。树莓派开机后首先进行系统初始化操作,然后运行相应程序文件。STM32单片机控制直流电机通过灰度循迹来到目标识别区,随后树莓派运行基于YOLOv3的深度学习图像识别算法依次识别目标物体。当检测到目标物体后,树莓派通过串口发送抓取命令,控制机械臂完成抓取动作,并将物品摆放在预定分类区域,随后智能交互机器人回到初始位置。

4.2串口与机械臂控制程序设计

树莓派与STM32单片机之间采用串口通信进行数据收发,树莓派识别出目标位置信息并以字符串的形式通过串口发送给STM32单片机。通过不同的指令完成车体不同的动作,实现上下位机的通讯与系统协调工作。智能交互机器人的机械臂由6个舵机构成,分别控制机械臂的关节1到关节5以及底盘。机械臂的动作控制依靠PWM控制舵机角度完成,通过STM32编程使得I/O口输出的PWM波占空比持续变化,进而使机械臂完成指定动作。

4.3YOLOv3目标检测算法

YOLOv3是一种快速、准确的深度学习目标检测技术,在检测速度与检测精度方面具有较好的综合性能。在进行图像特征提取时,YOLOv3运用了Darknet网络结构[3]。它与残差网络的工作原理相似,都是在层与层之间安排了快捷链路。YOLOv3进行目标识别时采用不同尺度的3个特征图,包括32倍降采样、16倍降采样以及8倍降采样,在多尺度featuremap上的检测与SSD类似。YOLOv3通过route层把浅层特征调用起来,将4次下采样后得到的浅层featuremap与16倍降采样得到的featuremap进行拼接,在深度学习网络的同时学习深层和浅层特征,具有更好的表达效果。YOLOv3网络结构如4所示[4]。YOLOv3通过多尺度检测[5-6],显著提高了mAP及小型物体的检测精度,并且通过残差网络形成了更深的网络层次。如果采用COCOmAP50作为评估指标,YOLOv3的表现相当惊人。它的检测速度是其他模型的很多倍。实际识别效果图如5所示。

5结束语

本文研究的智能交互机器人主要运用了YOLOv3深度学习算法,通过算法自动检测出图片中物体的位置,分类出边界框的物体的类别信息。主要运用在对货物进行合理的分类摆放,把各种不同的货物准确地摆放到合适的区域。通过该深度学习,系统不仅可以使机器人能够适用于各种不同的场景,而且YOLO算法的准确性以及高速也能够带来很大的便利。

作者:杨炅坤 黄景林 陈玥名 朱胤恺 罗宇昊 单位:中国计量大学机电工程学院