论文部分内容阅读
对于传统的爬虫技术,爬取轨迹数据时存在较低的覆盖率和效率,文中基于云计算技术架构构建了一套高效的分布式多源异构时空数据爬虫系统。由于系统以分秒级别获取基于timestamp的轨迹数据,而存储、计算等无法支持巨大的数据量,文中在TDTR算法的基础上,提出了一种基于T-Map(MCTD)的距离计算公式计算轨迹间距离的轨迹压缩算法(STCA),减少了需要的存储空间。