面向嵌入式AI平台的车辆变道安全提醒和驾驶员状态监测算法设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:goove8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通事故无时无刻不威胁着人们的生命以及财产安全,特别是近年来,由交通事故造成的损失已经不容忽视。为尽量避免由于行车环境复杂与驾驶员处于非正常行车状态而导致交通事故的产生,基于计算机视觉技术来实现辅助驾驶已经成为一个热点的研究问题,开发安全可靠的车载辅助变道系统和驾驶员状态实时监测系统就有着重要的实用价值。本文主要研究了实时场景车辆变道安全提醒算法设计和驾驶员状态监测算法设计以及它们在嵌入式AI芯片上的实现和应用。针对实时场景的车辆变道安全提醒依赖复杂标注数据的问题,本文提出了一种无需标注和识别车道线的端到端的“变道相关车辆”检测方案,并通过改进Mobile Netv2+SSD检测框架来实现嵌入式AI芯片上的准确快速检测。首先,在数据集制作时以车道线约束进行车辆标签的标注,只用标注变道相关车辆,利用深度卷积神经网络学习车辆相对于车道线的高阶语义位置信息,从而避免复杂的车道线分割标注;然后,将对应的检测头全部设计为深度可分离形式,从而保证模型推理的速度和系统的实时性;最后,针对车辆漏检和背景误检的情况,在相应的特征层加入稀疏自注意力机制,在保证效率的同时提高了检测的准确性,达到实用性标准。针对驾驶员状态实时监测系统存在实现流程复杂的问题,本文设计了一种驾驶员“面部整体+局部联合识别”的新型、简单、有效的技术方案。第一步,先将输入图片中人体的关键部位包括面部、眼睛、嘴巴和手部进行区域性检测;第二步,对检测到区域的状态进行相应的分类来具体判断人体所处的状态(正常、分心、抽烟、打电话、疲劳)。抽烟和打电话状态主要根据手部区域的状态来区分,考虑到眼睛、嘴巴相对于输入图片是小目标,采用面部区域缩放与眼睛嘴巴等区域放大相拼接的策略进行分类,以区分分心和疲劳状态。最后根据系统需求选择RK1808嵌入式AI平台,并基于该ARM板进行模型部署。本文通过提出的变道相关车辆检测、面部整体局部联合识别的方案和算法实现了实时、准确的变道安全提醒和驾驶员状态监测,并已集成进入车载设备投入使用。
其他文献
信息技术的快速发展为网络研究提供了新的方法,社区发现和节点角色划分作为网络研究领域两个重要的方向在近些年来逐渐被研究人员关注,它们在不同的领域有十分广泛的应用。现实世界中的网络往往是多层网络,多层网络相较于单层网络,能包含更多的信息,更大程度的反映真实的情况,本文针对多层网络社区发现和有向加权图的角色划分进行研究,主要贡献包括:1)现有关于多层网络社区发现以及节点角色划分任务的公开数据集缺少社区和
学位
随着移动互联网的快速发展,网络中用户数增多和服务的多样化,对网络系统中有限资源的调度分配方法提出了更高的要求。对基站的调度技术而言,如何通过更好的调度算法提升系统的整体性能,成为了第五代移动通信移动技术的重点研究内容。由于MIMO技术充分利用了空间复用增益,能够有效提升系统性能,而得到广泛应用。因此,应用MIMO技术的5G网络系统中用户调度算法的性能评估是本文的主要内容。而目前多用户传统调度算法完
学位
采用深度学习技术进行医学影像分析是当前的热点研究问题,其研究成果将辅助医生诊断并有利于促进人类健康。针对从三维CT影像中识别新型冠状肺炎和肺动脉栓塞这两个重要问题,为减轻医学专家的手工标注工作量,本文研究了在弱标记情况下(即只给定患者级别标签)深度网络设计与训练方法。新型冠状肺炎是近年来最重大的传染性呼吸道疾病之一,在全世界范围内已造成三百多万人的死亡。在新冠疫情初期缺乏病灶标注且计算资源受限情况
学位
随着信息技术的日新月异,自然语言处理在机器翻译、智能问答、文本分类等领域有着广泛的应用前景,为人们的生活带来很多便利。自然语言处理技术需要将海量的非结构化文本,加工处理成可被计算机学习和理解的数据对象。作为自然语言分析的基础,标注文本数据成为研究自然语言处理算法的一个必要步骤。本文详细介绍了一个众包文本标注系统,本系统为自然语言处理的研究人员以及文本数据标注者提供了一个语料标注的平台,满足多种标注
学位
步态识别是通过人的步态特征对行人身份进行识别,步态特征相较于其他生物特征有着明显的优势,即在远距离或低视频质量情况下的可辨别能力。由于人的走路姿态是一种长时间的行为习惯,这种习惯不容易隐藏和改变,步态特征难以伪装和模仿,可以用于行人身份的识别。近年来,随着人工智能和深度学习的发展,人们更倾向于利用人工智能技术来处理识别领域的一些问题,步态识别逐渐走进人们视野,在安防和刑侦领域都极具发展潜力。很多资
学位
近年来,随着无线通信技术的发展,越来越多基于无线网络的应用诞生。诸如无人驾驶、无人机、智能电网等物联网应用对通信带宽、时延等服务质量(Quality of Service,Qo S)指标的需要不断提高,这也使得在无线网络中,大量的基础设施需要共享有限的信道资源(如空间、频域、时域等)。因此,作为解决无线网络中资源分配问题的关键,调度一直都是无线通信中研究的核心和热点问题。本文研究的是无线调度中的经
学位
情感分析是情感计算领域的主要角色,该任务主要是利用计算机来检测、分析和评估人类对不同事件、问题等兴趣产物的认知,它的应用场景在我们的生活中可以说是无处不在,在商品零售、社会舆论、金融交易等领域均能够发挥巨大的作用。传统的情感分析大多数只是基于单一模态特征来进行推理,然而在我们周围的世界中,往往包含着多种多样的模态信息,比如我们身处于一个对话场景中时,除了面对面看到对方的面部表情外,还能够听见对方说
学位
基于RGB-D相机的即时定位与建图(Simultaneous Localization and Mapping,SLAM)技术是增强现实(Augmented Reality)的核心技术之一。然而,现有的RGB-D SLAM系统几乎只针对静态场景设计,当场景中出现动态物体时,现有系统的位姿估计会出现较大偏差,从而造成估计位姿的漂移。本文提出了一个能在动态场景中准确估计相机位姿的RGB-D SLAM系
学位
随着深度学习的发展,人工智能热潮兴起,自动驾驶、移动机器人等技术成为当前的研究热点。这些智能化应用中,双目视觉技术被广泛使用,而立体匹配是双目视觉技术的关键。近年来,卷积神经网络在立体匹配任务中表现出了良好的性能。然而,基于深度学习的立体匹配方法通常使用空间共享的卷积权值,这导致现有方法面临着一个困境,即适合于在平滑区域聚合上下文信息的权值往往会模糊纹理区域的局部匹配细节,反之亦然。本文旨在设计一
学位
近些年来深度学习在不断地发展,它在人脸检测、语音识别等领域都发挥出了重要作用。在现在的大数据时代,越来越多的数据可以被建模成图关系,例如化合物分子、社交网络等。图结构数据中的每个节点都包含其特征与其他节点的联系关系,图神经网络则可以利用这些信息来完成例如节点分类、图分类、链路预测等任务。但现有的应用于图分类任务的图池化模型大多是通过复杂的度量方法来计算节点重要性,但这相应的会导致计算复杂度的提升。
学位