【摘 要】
:
随着计算机技术的飞速发展,网络应用系统中持续产生、传输和处理海量流数据。这些数据往往数据量大、类型多、流速快,且价值密度低。如何从大规模单体价值较低的数流据中获取
论文部分内容阅读
随着计算机技术的飞速发展,网络应用系统中持续产生、传输和处理海量流数据。这些数据往往数据量大、类型多、流速快,且价值密度低。如何从大规模单体价值较低的数流据中获取高价值的信息,是大数据时代发展的关键。复杂事件处理是一种基于事件流的技术,它将数据抽象为不同类型的事件,通过过滤、关联、聚合等操作分析事件间的关系,最终由简单事件得到高级事件。由于相当多的流数据可抽象为事件流,对流数据的检测处理可抽象为复杂事件的检测处理,因此发展具有更强描述能力、更高检测效率的复杂事件检测方法,成为了解决大数据时代流数据处理问题的主要方法之一。对于复杂事件处理,强复杂事件描述能力和高复杂事件检测效率是一对矛盾。组成复杂事件的多个简单事件之间往往具有时序约束关系和结构约束关系,因此高级的事件模式应提供丰富的时序描述能力和结构约束关系,但也不可避免地增加了检测算法的复杂性;另外,快速达到的流数据更增加了计算资源和存储资源的开销。本研究通过利用计算机多核计算能力,提出了一种并行复杂事件检测方法CEDPRT,为解决上述问题提供了一种新的思路。该方法采用描述能力较强的正规树模式作为描述复杂事件检测请求的事件模式,使其既可以处理事件间具有结构约束的用户检测请求,又可以处理具有时序约束的请求,具有“强描述能力”;通过自动机和映射表方法,提出一个新颖完备的数据并行处理正规树模式匹配方法,使计算机的多核优势在海量流数据的处理中得到充分利用;通过树有序化操作,将匹配任务分解,实现任务并行与数据并行相结合处理正规树模式匹配,使方法处理检测速度提升,具有“高检测效率”。通过实验验证了CEDPRT方法的复杂事件描述能力和复杂事件检测效率,在大数据时代实际的流数据处理问题中,CEDPRT方法可使用户更高效地获取更深层次的信息。
其他文献
茴香醛是一类重要的高附加值精细化学品,广泛应用于食品、香料、化妆品、医药和电镀等领域。因此,研究如何制备品质优良的茴香醛具有很大的应用价值。目前电化学法合成茴香醛
钯(Pd)具有独特的催化性质,尤其对氢有较强的亲和力,在催化、光学、电学和磁学等领域具有广阔的应用前景。形貌是影响纳米晶体材料性质的重要因素,对其催化活性及选择性影响
孟加拉国自古就是中国的重要贸易伙伴,与中国的经贸往来历史可谓源远流长,最早的贸易记录甚至可以追溯到秦汉时期的“南方丝绸之路”。近几年来,中孟两国的双边贸易总额和增速都达到了两国贸易交往历史中最好的水平。两国的政治关系处于合作加深的状态,在2016年两国正式建立了战略合作伙伴关系。中孟两国双边贸易出现了新的特征,同时也遇到了新的问题。影响两国贸易潜力实现的贸易非效率因素也发生了一些新的变化。在这种新
珠江口盆地是我国南海北部最重要的油气勘探开发区域,研究区位于盆地中部,包括番禺低隆起、白云凹陷北部和荔湾凹陷部分区域。本文综合应用层序地层学、地震沉积学等理论知识
新城疫病毒(Newcastle disease virus,NDV)作为危害养禽业发展的一种急性传染性疾病,迄今为止波及全球一百多个国家,造成了巨大的经济损失。同时,NDV作为溶瘤病毒的研究也有5
研究区长岭断陷的目标层泉头组和登娄库组为构造背景下的深层碎屑岩气藏,经过以往的油气勘探显示,该区的目标层气藏具有巨大的勘探前景。但是由于研究区受多期次构造运动的影
自Zadeh提出Z-numbers的概念以来,关于Z-numbers和其衍生概念的研究受到了大量的关注,但Zadeh曾提及的其中一个衍生概念――Z~+-numbers,却并未受到多少关注.相比较于Z-numbe
本文给出了复形的伴随预包络和伴随预覆盖的定义,研究了复形的伴随预包络和伴随预覆盖的存在性与性质,并讨论了复形的伴随预包络、伴随预覆盖、预包络和预覆盖之间的关系.作
蛋白质水凝胶具有良好的生物相容性/可降解性,及低细胞毒性/免疫原性等,因此能应用于组织工程、药物释放、再生医学等领域。但较差的力学性能限制了蛋白质水凝胶发展与应用,而目前增强蛋白质水凝胶的方法存在一些不足,如方法不通用、缺少有效的能量耗散机制和来源单一等。牛血清白蛋白(BSA)含有丰富的可反应官能团,可以使用多种方法制备出水凝胶。因此本文选用BSA作为蛋白质模板,使用不同的方法制备了三种基于BSA
现场可编程门阵列(Field Programmable Gate Array,FPGA)供应链的全球化和FPGA的广泛应用引起了人们对于FPGA硬件安全问题的重视。目前存在一些以网表和RTL代码为研究对象的