基于DM642的“行人”语义提取及应用

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:kykyky666888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能、模式识别等领域,视频图像分析是一项极重要且极具挑战性的工作,它的最终目标是让电子设施完全模仿人的视觉系统功能,让电子设施拥有人类视觉系统的感知、理解图像的能力。自从引入“语义图像”这一概念,我们向这一目标又迈进了一大步,对图像的理解不再仅仅局限于底层。虽然图像的高层语义是图像处理领域的新生事物,但毫无疑问,他终将会有长足的发展。以往大部分的视频图像处理系统,多是以大型服务器、个人计算机为基础架构,然而随着科技进步,数字信号处理器(DSP, Digital Signal Processor)的功能比以往更加强大,传统以大型服务器、PC机为基础的视频图像处理系统,通用性虽强,但效率低且不适于独立运作,而在DSP所建构的系统(DSP-based System)上,大量复杂的运算处理采用专用硬件实现,准确度高且效能也高,同时体积小,方便独立运作,能满足大部分系统的实时性需求。本论文利用德州仪器生产的数字信号处理器TMS320DM642作为开发平台,建立一套实时的“行人”语义提取系统。论文的主要工作包括:(1)嵌入式软件开发平台的构建。分析了TI公司的RF5框架及一个XDAIS标准算法实例,在此基础上以线程(Thread)、通道(Channel)、核(Cell)和标准算法(XDAIS algorithm)的层次模式进行了本系统的设计;对TI的DSP/BIOS嵌入式内核进行了相应的裁剪配置,加入了性能监视插件模块。(2)候选语义区域ROI(Region Of Interest,感兴趣区域)检测。依照RF5框架及XDAIS算法标准,将PC机上常用的两种移动目标检测算法(时域差分法、光流法)移植到了DSP上,然后对检测结果进行了中值滤波及Blob分析,得到ROI。对时域差分算法的移植过程进行了详细阐述,包括内存配置,数据搬移等。实验后分别对两种算法的DSP使用负荷、系统最大堆栈使用深度、最大中断响应时间等算法性能指标进行了评估。(3)“行人”语义特征的提取及匹配。设计了适用于本文嵌入式系统的“行人”语义特征模板,提取了“行人”语义特征,根据DM642 DSP可直接并行计算几个乘法的特性,提出了高效的内积匹配算法用于“行人”语义的匹配,检测出了图像序列中的运动人体,分析了实验结果。本文的研究工作将图像语义的概念引入了嵌入式领域,对图像语义在嵌入式设备上的应用作了一次有益尝试,取得了一些令人满意的初步研究成果。
其他文献
在信息化社会中人们对信息的需求是巨大的,视觉是人类获取信息的最主要途径,也是人类最高级的感官;图像由于本身的优势,在人类感官中扮演着重要的作用,成为人们利用信息的主
随着物联网技术的发展,智慧家居、智慧交通、智慧医疗等概念相继被提出,人们的生活朝着智慧化、个性化的方向发展。物联网中,一项很重要的技术就是感知,即运用射频识别、传感
OFDM是LTE、Wimax等准4G中的关键技术,而CDMA是3G的一种实用的通信方案。结合OFDM和CDMA技术的多载波CDMA系统充分利用了OFDM最优频率利用率以及CDMA系统多址和频率分集技术,且
互联网上的多媒体应用正在得到广泛部署,诸如IPTV、电视会议、远程教学等业务将会造就一个新的增长点。作为承载此类点到多点业务最有效的网络传输方式,组播只需在必要的分枝
多媒体通信客户端面对用户快速膨胀的智能化和高性能需求,支持业务种类繁多,业务间协作、交互或同步关系复杂,是多媒体通信技术的研究热点。针对当前多媒体客户端在多种业务
视频码流是经过高效压缩的数据,其比特流之间的相关性非常强,因此对误码或数据丢失很敏感。在分组网络通信中,由于因特网只能提供“尽力服务”,因此分组丢失不可避免。这样,