论文部分内容阅读
RFID无线射频识别技术,利用射频通信实现非接触式自动识别,可以在运动过程中快速、高效、安全的识读和存储物体信息。车联网是RFID的一个应用方面,装载在车辆上的电子标签被无线射频RFID识别后提取出车辆的静动态属性信息,并对信息进行分析利用。对提取出的RFID路径数据进行压缩可以减少存储数据的空间,对RFID路径数据进行频繁模式挖掘可以了解车辆移动的路线状况以及移动的趋势,辅助相关的决策过程,便于进行交通规划设计等。在RFID路径数据压缩方面,由于RFID路径数据的时空特性,以路径数据的EPC码作为键值从地点和时间维度两方面整合路径信息。对RFID路径数据的位置信息压缩时,将可扩展标记语言中的重复分配素数编码方法MBPrime应用到RFID路径编码中,是在PrimeLabel编码方法的基础上对素数分配策略进行了改进,每条路径的编码可以用该路径上的最后一个位置的编码来表示。对RFID数据整体路径信息压缩时,提出了一种基于字典压缩的R-LZW算法,该算法对阈值判断方法进行了改进。在RFID路径频繁模式挖掘方面,提出两种方法。第一种是在CloSpan闭序列算法基础上提出的PathMining算法,对路径数据库以深度优先顺序构造出可以反映频繁模式搜索空间的语法序列树LST,在构造序列树的过程中合并等价的子树并删除候选集合中的非闭合序列完成对LST的剪枝,可以减少不必要的搜索,以适应对RFID路径的频繁模式挖掘。第二种是通过数据流滑动窗口挖掘闭序列模式,在IST反序列概念上提出一种ICR-Tree结构,该结构通过判断节点类型确定路径是否频繁,引入二级哈希索引结构对路径进行闭包检查。并在优化算法时利用衰减因子动态调整最小支持度,使ICR-Stream算法能够更加高效的从滑动窗口中挖掘出闭序列模式。本文使用模拟数据对算法进行验证,通过实验验证了MBPrime编码方法能高效的完成对RFID路径数据中位置信息的编码处理和R-LZW能够对路径的全部信息进行压缩存储。在路径频繁模式挖掘中PathMining算法在时间空间方面比较有优势而ICR_Stream算法挖掘的频繁路径覆盖率更高。