论文部分内容阅读
在人工智能、模式识别等领域,视频图像分析是一项极重要且极具挑战性的工作,它的最终目标是让电子设施完全模仿人的视觉系统功能,让电子设施拥有人类视觉系统的感知、理解图像的能力。自从引入“语义图像”这一概念,我们向这一目标又迈进了一大步,对图像的理解不再仅仅局限于底层。虽然图像的高层语义是图像处理领域的新生事物,但毫无疑问,他终将会有长足的发展。以往大部分的视频图像处理系统,多是以大型服务器、个人计算机为基础架构,然而随着科技进步,数字信号处理器(DSP, Digital Signal Processor)的功能比以往更加强大,传统以大型服务器、PC机为基础的视频图像处理系统,通用性虽强,但效率低且不适于独立运作,而在DSP所建构的系统(DSP-based System)上,大量复杂的运算处理采用专用硬件实现,准确度高且效能也高,同时体积小,方便独立运作,能满足大部分系统的实时性需求。本论文利用德州仪器生产的数字信号处理器TMS320DM642作为开发平台,建立一套实时的“行人”语义提取系统。论文的主要工作包括:(1)嵌入式软件开发平台的构建。分析了TI公司的RF5框架及一个XDAIS标准算法实例,在此基础上以线程(Thread)、通道(Channel)、核(Cell)和标准算法(XDAIS algorithm)的层次模式进行了本系统的设计;对TI的DSP/BIOS嵌入式内核进行了相应的裁剪配置,加入了性能监视插件模块。(2)候选语义区域ROI(Region Of Interest,感兴趣区域)检测。依照RF5框架及XDAIS算法标准,将PC机上常用的两种移动目标检测算法(时域差分法、光流法)移植到了DSP上,然后对检测结果进行了中值滤波及Blob分析,得到ROI。对时域差分算法的移植过程进行了详细阐述,包括内存配置,数据搬移等。实验后分别对两种算法的DSP使用负荷、系统最大堆栈使用深度、最大中断响应时间等算法性能指标进行了评估。(3)“行人”语义特征的提取及匹配。设计了适用于本文嵌入式系统的“行人”语义特征模板,提取了“行人”语义特征,根据DM642 DSP可直接并行计算几个乘法的特性,提出了高效的内积匹配算法用于“行人”语义的匹配,检测出了图像序列中的运动人体,分析了实验结果。本文的研究工作将图像语义的概念引入了嵌入式领域,对图像语义在嵌入式设备上的应用作了一次有益尝试,取得了一些令人满意的初步研究成果。