基于Web会话序列的异常检测研究

来源 :福建师范大学 | 被引量 : 0次 | 上传用户:vcnewer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web技术的发展,互联网中每时每刻都在产生着大量的数据,如何从这些数据中挖掘出有价值的信息和规律无疑是一个研究热点,但数据中混杂的异常数据严重影响着数据的挖掘质量。不仅如此,异常数据往往还代表着可能存在的安全威胁,其本身也存在着待挖掘的价值。为了提高应用系统的安全性和数据挖掘的质量,如何从大量数据中发掘异常信息是一个亟需解决的问题。在离线环境下,现存的异常检测技术面对现实环境中无标签的真实数据难以发挥作用。在在线环境中,Web数据处于不断更新中,现有的技术可能难以及时的对异常数据进行检测和定位。因此,构建完整高效的异常检测模型对提高数据挖掘质量和系统安全具有重要的意义和价值。针对以上问题,本文应用多种机器学习方法构建了完整的异常检测方案。本文的解决方案主要包括以下几点:(1)提出了会话特征相似性异常检测算法:SFAD。该方法针对Web序列数据构建相似性矩阵,并根据模糊聚类的λ切割方法分离出可疑用户,通过多个滑动窗口的检测最终从可疑用户中检测和定位异常用户。(2)提出了基于Min-Hash和LSTM的异常检测MH-LSTM算法。该方法采用Min-Hash方法从Web序列数据中提出数据特征,将提取的特征放入设计好的LSTM网络中进行训练。通过滑动窗口的方式将待检测的在线数据进行分割,针对窗口内的数据采用训练好的LSTM网络检测,实现对异常数据的检测定位。(3)提出了完整实用的异常检测模型。在线环境中,数据的分布变化问题容易导致在线模型的准确性下降。本文将离线模型和在线模型进行结合,采用增量更新的方式对模型进行更新。离线模型检测数据分布供在线模型更新以解决可能发生的数据分布的变化问题。实验表明,本文提出的离线异常检测模型检测率在98%左右,在线异常检测模型检测率在97%左右。完整的异常检测模型能够有效的应对分布问题并保证一定的异常检测率。
其他文献
目的:采用高效液相色谱(high performance liquid chromatography,HPLC)法建立白消安(busulfan,Bu)在Beagle犬体内的定量测定方法,对白消安在Beagle犬体内不同给药途径的药动学特征进行评价;测定Beagle犬体内谷胱甘肽巯基转移酶(glutathione S-transferase,GST)活性,研究白消安和环磷酰胺(cyclophosph
海面风向、风速信息是船舶航行安全以及风致结构振动的重要海洋信息,对气象观测、船舶操纵、船舶结构设计、军事及科研领域都有着至关重要的意义。而掌握海洋船舶所受风影响
微波炉产品外观零部件配合间隙均匀度是微波炉质量控制的重要内容之一,会直接关系到消费者是否愿意购买该微波炉产品。W公司是一家专门从事家电产品设计制造的大型跨国企业,
白酒为中国特有的一种蒸馏酒,在白酒酿造过程中,添加适量的蛋白酶,能有效地水解原料中的蛋白质,促进菌体生长繁殖,提高原料利用率,生成多种香味物质,蛋白酶产生菌在白酒生产
目的:以4-磺酰氧基苯并噁唑酮为先导物,设计合成新型N-烷基-4-磺酰氧基取代的苯并噁唑酮类衍生物,并评价其iNOS抑制活性及其抗炎活性,以期获得具有高效抗炎活性的新型iNOS抑制剂。方法:以2-氨基间苯二酚为起始原料,经缩合反应制得4-羟基-苯并噁唑酮,继续与磺酰氯及其卤代烃反应后制得目标化合物,并采用ESI-MS、1H-NMR、13C-NMR对其进行结构确证;通过Griess法测定化合物对LP
普鲁兰酶属于脱支酶的一种,其可以高效并且专一的的切开支链淀粉中的α-1,6-糖苷键,从而切下支链淀粉的整个支链,形成直连淀粉。这个特点决定了普鲁兰酶蛋白在以淀粉为原料的的工业生产活动中,不管是单独使用还是配合其他淀粉酶共同使用,在降低淀粉质类原料的使用量、降低生产成本、减少废弃尾物,保护环境方便具有很高应用价值。与普鲁兰酶高的应用价值不相匹配的是其较高的酶产品的价格,由于普鲁兰酶是淀粉酶类中唯一一
无人机出色的机动性使得它在越来越多的领域得到广泛应用,但飞行功耗大以及有限的电池容量导致其续航能力不足,无法去执行需要长时间或者远距离飞行的任务。另一方面,随着城
岩石是一种由多种矿物组成的天然非均质材料,矿物细观力学特性对岩石宏观力学行为有重要影响。矿物力学性质的不均匀性和岩石细观结构发育程度的不同,是岩石宏观力学性质表现
BiFeO3(BFO)作为多功能材料和器件的应用基础,其具有室温下的铁电、铁磁性。然而高泄漏电流、大矫顽场已经成为技术发展应用的障碍。离子掺杂已经被证明可以改善泄漏电流。构
红茶菌是以茶糖水为发酵基质,经醋酸菌、酵母菌和乳酸菌等天然存在的混合菌群发酵而成的饮料,包含菌液和菌膜两部分。本研究利用宏基因组技术准确掌握红茶菌发酵过程中微生物