论文部分内容阅读
随着移动通信技术、全球定位技术以及智能手机的迅猛发展,移动对象轨迹数据不断积累,呈现出爆炸式增长趋势,对于移动对象的轨迹预测的需求逐渐增加,移动对象的轨迹预测成为当前的研究热点。本文以稀疏轨迹的预测为研究问题,围绕稀疏轨迹预测方法展开研究,主要研究内容如下:(1)基于熵估计和矩阵分解的稀疏轨迹预测轨迹预测时,存在“数据稀疏”问题。为了解决这一问题,本文提出了一种基于熵估计和矩阵分解的稀疏轨迹预测方法(Entropy-based Sparse Trajectories Prediction Enhanced by Matrix Factorization,ESTP-MF)。首先,对轨迹区域进行网格划分,将原始轨迹点序列转换为轨迹网格区域序列。然后,采用轨迹熵评估评价轨迹的规律性,去除熵值高的轨迹;并在此基础上,划分交叉轨迹形成子轨迹,通过基于熵值的轨迹综合得到规律性更强更丰富的新的轨迹空间;在新的轨迹空间下,采用马尔可夫模型进行预测。然而,由于转移概率矩阵仍然存在数据稀疏问题,通过矩阵分解参考少量已有的轨迹转移概率矩阵中的元素来拟合推测部分缺失(未观察到)区域的转移概率,以此评估总的轨迹转移概率矩阵进行稀疏轨迹预测,进一步解决数据稀疏问题。采用T-Drive Taxi Trajectories数据集进行实验,实验表明,ESTP-MF进一步地解决了数据稀疏问题,提高了预测准确率。(2)基于快速时间意识张量分解的稀疏轨迹预测由于现有轨迹预测的马尔可夫模型使用单个转移概率矩阵,忽略了时间因素影响。为了解决该问题,本文提出了一种基于时间意识快速张量分解的稀疏轨迹预测方法(Fast Time-aware Sparse Trajectories Prediction with Tensor Factorization,TSTP-TF)。首先,在单一转移矩阵的基础上增加时间维,为轨迹的转移概率构建四维转移概率张量。其次,为了解决数据稀疏问题,通过张量分解方法丰富转移概率张量。然而,由于多维转移概率张量规模较大,张量分解对于空间要求过高,设计了一种分而治之的张量分解模型,减小内存消耗,提高分解速度。实验表明,TSTP-TF进一步地解决了数据稀疏问题,与ESTP-MF方法相比提高了预测准确率。(3)差分隐私保护下的稀疏轨迹预测轨迹数据可能会泄漏个人隐私信息,马尔可夫概率转移矩阵作为轨迹预测的中间数据,对其进行差分隐私保护可以减少隐私泄露。本文主要研究如何在发布并利用马尔可夫概率转移矩阵时,减少隐私泄露的风险,并探讨本文的稀疏轨迹预测方法在差分隐私保护下的预测可用性。首先,针对轨迹转移矩阵,在拉普拉斯噪音机制的基础上提出状态限制的轨迹差分隐私保护算法(Differential Privacy Protection based on Transition State Number Restrictions,DPP-TSNR),给马尔可夫概率转移矩阵添加噪声。随后在发布数据差分隐私保护的情况下,采用本文提出的ESTP-MF方法进行轨迹预测,完成差分隐私保护下的稀疏轨迹预测。采用Gowalla数据集和Geo Life数据集进行实验,实验表明DPP-TSNR可以很好的进行差分隐私保护,在保证轨迹稀疏数据的隐私性的同时提高数据的可用性。在差分隐私保护下与基于马尔可夫模型的轨迹预测方法相比ESTP-MF方法提高了预测精度,降低了预测误差,可以很好的进行轨迹预测。