频繁序列模式相关论文
PrefixSpan算法是目前比较经典且较为高效的挖掘频繁序列模式的算法,而应用在旅游热门路线的搜索上,仍存在着连续性不足的问题.为......
本文以序列模式的数据库为切入点,在对具有序列特征的数据进行预处理的基础上,重点对序列模式数据挖掘算法进行了深入研究,以期通......
随着网络规模不断扩大,网络结构日益复杂,如何保证网络高效、稳定运行,已经成为网络管理的重要问题。正确的网络告警相关性分析可......
随着统计方法在自然语言处理中的广泛应用,双语语料库资源对于自然语言处理研究的巨大价值已经得到越来越多的认可,尤其在机器翻译......
本文提出了一种有效的频繁模式挖掘算法,通过研究Sendmail各进程中的系统调用号之间的关联关系,建立正常以及异常行为序列库,利用......
分析了现有频繁模式聚类算法的不足,提出了距离函数改进,并在模式聚类函数的基础上生成一个压缩的偏序(partial order)的算法(FCWS......
传统的类Apriori频繁序列模式挖掘算法都是基于支持度框架理论,需要预先设定支持度阈值,而这通常需要较深的领域知识或大量的实践,......
WebLog挖掘的基本思想是将数据挖掘技术应用于Web服务器的日志文件,且客户对服务器的访问模式是一种序列模式.本文在基于一种简化......
双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规......
海量的交通流数据中一定隐藏着某些潜在的交通状态演变规律,然而少有研究能以实验的方法支持这种观点。本文提出一种基于频繁序列匹......
随着互联网的发展.Web挖掘技术已经成为数据挖掘技术的一个研究的热点。本文对Web挖掘的特点、方法进行了讨论,提出了结合网页的链接......
在许多科学和商业领域,序列模式的发现技术发挥着越来越重要的作用,然而人们对于高效的基于投影树算法的并行模式关注较少。该文首先......
基于频繁序列模式压缩技术的网站结构优化算法旨在发现用户在浏览过程中频繁访问的序列关联,为优化站点结构提供有力的依据。分析了......
现有的体育视频分析方法大多都专注于重要事件的提取,而忽视了如何对这些事件进行组织和语义分析。本文提出了一种基于序列模式挖......
旅游产品推荐是当前推荐系统研究领域中的新兴议题之一.由于旅游产品描述信息维度多样复杂、"用户-产品"关联矩阵极为稀疏且冷启动问......
针对Web日志文件提出了一个简单的数据挖掘模型,并以关联规则为理论基础,结合该模型设计一个高效的序列模式挖掘算法。该算法得到......
从序列数据库里挖掘出带通配符约束的频繁序列模式成为现代数据挖掘领域中的一个焦点,也有一些高效率的算法。本文在分析Disc-all......
针对电子病历中疾病诊断文本同义词识别和命名标准化问题,提出了一种自适应的文本聚类方法.首先提出了一种新的基于集合的文本相似......
基于频繁序列模式的压缩技术旨在提高数据挖掘结果的可用性和可理解性,从庞大的序列模式中发现有用的知识。分析了现有频繁模式压......
频繁序列模式挖掘是数据挖掘领域的1个基本问题,然而模式本身及其支持度计数都有可能泄露用户隐私信息.差分隐私(differential pri......
数据是与自然资源一样重要的战略资源,大数据技术就是从数量巨大、结构复杂、类型众多的数据中,快速获得有价值信息的能力,它已成......
随着互联网与电子商务的快速发展,网站产生的点击、商品、交易等数据呈现海量数据式增长。淘宝网(taobao.com)中的页面每天点击超过2......
双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规......
机器学习作为人工智能的核心技术,已经在许多领域得到应用,并发挥了重要作用.国务院近日印发了《新一代人工智能发展规划》,提出了......