论文部分内容阅读
现代社会,预测人群场景中的群体行为,得到多个人群之间交互的未来轨迹已经成为复杂场景下的研究热点,在计算机视觉等领域中引起了广泛的关注,基于现有的轨迹预测框架,结合各大代表性轨迹预测算法的理论基础,本论文提出了一种新的基于生成对抗网络的可解释模型。本论文以场景中所有行人的历史轨迹数据和原始场景图片数据作为模型的输入,在生成对抗网络框架的基础上,新引入了物理注意力机制和社会注意力机制对轨迹预测进行双重考虑,得到更符合物理及社会规范的行人未来预测轨迹。本文具体的研究内容如下:(1)在生成对抗网络框架的基础上,新引入了物理注意力机制和社会注意力机制。物理注意力模块有助于网络提取场景的地形等背景信息,得到更值得关注的重要区域,避免无效的预测,增加预测的准确性;社会注意力模块能够聚合不同行人之间的信息并提取来自周围行人的最重要的轨迹信息,使得此方法能够预测出符合社会规范的路径。物理及社会双注意力机制的补充,弥补了传统预测算法未考虑到场景环境信息的问题,实现了对行人更合理更精确的预测。(2)本文使用生成对抗网络作为预测算法的基本框架下,使得本模型同时也能够实现对行人未来轨迹的多模态预测。轨迹多模态的本质就是基于行人轨迹和场景的历史信息,行人可以有多条可接受的未来路径。通过在多个仿真数据集上的测试,我们验证了本文模型确实具备多模态生成属性。再考虑到对人群未来轨迹的预测,我们首先对场景中各个不同人群的轨迹进行聚类处理,得到每个人群轨迹的聚类结果。再将此聚类结果作为均值轨迹数据向上述模型输入,大致预测其未来时刻的轨迹,此即为人群的趋势方向预测。(3)本文在真实的基准数据集ETH、UCY上进行了实验,其数据指标结果可以证明本模型在预测准确性表现方面优于简单的线性网络、长短期记忆网络及衍生的社会长短期记忆网络和社会生成对抗网络等轨迹预测模型。在人群趋势预测方面,我们首先验证了人群聚类算法的准确性,再可视化了人群趋势的预测,得到了对人群准确的趋势方向的预测。