基于Web日志的政府网站热点信息挖掘技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:thm99811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的快速发展和应用,加快了现代人的生活节奏,影响了人们的生活方式。Internet技术在个人生活、企业管理以及电子商务的应用,使人们能够更加快速和便捷的获取想要的信息,使企业具有更高的工作效率。同样应用也对国家政府部门的工作提出了快捷、高效的要求。我国的电子政务在国家支持下经过了这些年的发展在政务办公自动化和政府网站建设等方面已经取得了一定的成果,在此期间积累了大量的数据。尤其政府部门的门户网站,更是积累了海量用户访问日志。如何利用分析这些历史数据,进而发现其潜在的规律,为今后政府网站的发展提供科学指导成为一个重要课题。   Web数据挖掘技术可有效的利用Web数据,使其发挥价值,它是数据挖掘技术和Web技术的结合。其主要目的是分析挖掘Web数据中潜在的有价值的信息或规律。Web数据挖掘中的Web日志挖掘技术是对网站运行过程产生的日志进行分析处理,发现数据背后有价值的模型,将其应用于网站结构优化、性能优化方面,从而为用户提供优质的服务。   本文在政府网站Web日志挖掘方面做了相关研究。首先,介绍数据挖掘技术、Web数据挖掘的基本概念和分类以及Web日志挖掘的应用领域和实现过程。然后,通过分析现有Web日志挖掘算法,针对政府网站的内容特点,定义了区域及区域访问度、频道及频道访问度的概念和计算方法以及基于区域-频道访问的概念设计Web访问矩阵,进而设计了基于区域-频道访问度的民意热点信息挖掘算法(PHIMA)。采用新疆昆仑网政府网站的Web日志数据进行对比试验,验证该算法有效性;分析影响该算法性能的因素,验证算法的性能优越性。最后,以PHIMA算法为基础,设计基于该算法的政府网站挖掘系统框架和功能框架,为基于PHIMA算法的政府网站日志挖掘系统开发提供指导。  
其他文献
人体检测技术是计算机视觉领域一个重要的研究方向,是实现智能监控等应用的关键,具有很强的实用价值。许多基于人体目标的高级技术,如异常行为分析、行人追踪等,都直接依赖于人体
随着信息化发展和网络技术的广泛应用,网络安全性变得至关重要。继防火墙,数据加密等安全保护措施后,入侵检测系统成为新一代的安全保障技术。传统的入侵检测系统都有一些缺
随着城市化进程的逐步推进,城市建设快速发展,各类建筑物的地下部分所占空间越来越大,地置深度越来越深。基坑工程向更大、更深、条件更复杂的方向发展,变得更加规范化、信息
无线传感器网络是由部署在监测区域内的大量廉价传感器节点,通过无线通信方式形成的一个多跳的自组织网络,以其低成本、低功耗、自组织和分布式等特点带来了一场信息感知的革命
引文推荐系统的任务就是对书籍文献中的文字片段给出合适的备选引用文献供作者和读者参考,无疑这对于文字工作者而言非常有用。引文推荐问题可以被转化为一个信息检索问题,其中
在任何组织中,允许内部员工外联网络都是一种必然要求,但过多的与工作或学习无关的网络行为将严重影响效率,更可能引发内部安全问题,根据多个机构发布的调查报告,在我国企业
近十年来,基于IP网络的语音及视频通话在技术上发展迅速,其实际应用也越来越广泛。视频通话功能满足用户对实时通讯更高的需求,具有很好的应用前景。PKUnity-3(65)是一款由北京
随着物联网时代脚步的临近,嵌入式系统的在网络端的应用与日俱增。然而目前主流的IPv4协议由于其有限的地址位,是无法满足物联网时代海量的地址分配需求。因此采用128位的地址,
在无线传感器网络应用中,节点的位置信息对传感器所采集数据的有效应用起着重要作用,节点定位技术因而成为无线传感器网络研究领域的关键技术之一。传感器网络应用环境的开放性
软件测试按测试的执行阶段可划分为单元测试、集成测试、系统测试和验收测试。作为软件测试的第一阶段,单元测试只对软件中的最小可测试单元进行检查和验证,相对于其他阶段的