论文部分内容阅读
长流识别对流量工程、网络操作和网络管理都有着重要意义。大量的流测量的研究表明:在各种网络中,流的分布表现出明显的重尾特征,即大多数的流(短流)仅拥有少量的报文,而少数的流(长流)却拥有大量的报文。相较于流的总数,长流的个数非常少,但同时它们也占有着网络流量的大比例。了解了网络传输中长流的信息就能够很好地掌握此次通信行为。在这篇论文中,我们研究并改进可逆Bloom Filter,使它能够更好地应用到长流识别中。本文首先介绍了Bloom Filter及其变体在网络测量中的应用情况。然后重点说明可逆Bloom Filter,它也是由Bloom Filter变形得到的,是近几年新提出的一种网络测量技术。文中的可逆Bloom Filter包括8个哈希函数,它们选取源串的部分比特位作为哈希函数的哈希值。可逆Bloom Filter可以根据哈希函数的特性和流分布的重尾特征还原出长流完整流标识和长度信息。所以,可逆Bloom Filter识别长流不需要再为每个哈希表项维护流标识。此外,可逆Bloom Filter为每个哈希函数分配独立的存储空间,消除了哈希过程中的内部冲突。在流标识的还原过程中,还原算法只作用在那些超过阈值的哈希短串上,相较于所有短串这些短串的个数是很小的,所以极大地减少了计算量。本文使用从CERNET网络上收集的Traces进行离线模拟实验。实验结果表明,文中提出的可逆Bloom Filter的算法可以精确地获得长流的标识信息和长度信息。尽管学术界的努力使可逆Bloom Filter的研究和发展上都取得一定成果,但是可逆Bloom Filter仍然是网络测量中的一种较新的技术,还需要优化。本文的研究和改进使可逆Bloom Filter能够更有效地应用到长流识别中。