基于RBF神经网络的网页分类技术研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:dezhouhaote6600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的普及,网络已经成为人们获取信息的主要途径,为了帮助人们从海量网页中获取有用的信息,网页自动分类技术应运而生,其可以快速有效地分析和组织海量网页信息,它是利用机器学习的方法对网页实现自动类别标注。在众多网页分类算法中,RBF神经网络因其出色的分类能力,成为机器学习的研究热点。介绍了网页分类的流程,分析了RBF神经网络技术发展、原理和相关技术,讨论了RBF神经网络在网页分类中的重要作用。阐述了目前RBF神经网络常用训练算法,研究了在多实例多标签框架下发展而来的MIMLRBF神经网络模型。针对MIMLRBF在不平衡样本下分类效果差的问题,提出了改进的训练算法,考虑了样本的整体分布情况,使各类上产生的隐含层神经元趋于平衡,减少了不平衡样本对网络模型的影响。针对SVD方法在含有噪声数据的样本集上会导致网络整体误差变大的问题,提出了基于最速下降法优化的权重训练算法,使用SVD方法初始化权值矩阵,采用最速下降法优化权值矩阵,并利用新权值矩阵的误差平方和函数计算学习率矩阵,提高了MIMLRBF神经网络在含有噪声数据的样本集上的分类精度。最后,将改进后的训练算法应用到网页分类系统中,并对改进算法进行了实验对比和性能分析。实验数据表明,本文算法具有更高的分类效率和准确率。
其他文献
随着Web应用技术的迅猛发展,Web应用已经涉及到人们生活的各个领域,Web应用系统漏洞检测技术日益成为国内外学习和研究的热点与重点。但是,Web应用系统漏洞自动化检测技术还处于
无线传感器网络(Wireless Sensor Network, WSN)是伴随着传感器技术、无线电通信技术、计算机网络等技术的发展而产生的一种新兴的通信技术。由于无线传感器网络一般具有规模
随着互联网技术的不断发展,社会网络逐渐渗入到人们生活的方方面面。人们进行的各种社交活动使得社会网络中每天都会产生海量的信息在用户之间传播与扩散,并且这些海量的信息
信息化进程的深入发展,使得网络安全问题日益突显。本文首先对当前网络安全现状进行了分析,发现恶意代码呈现出趋利性这一特征,这一特征决定了恶意代码由之前的主动式攻击转向隐
在机器人领域,运动学和运动规划一直占有重要的地位。无论是工业机器人,还是应用于空间探测的空间机器人,以及智能机器人,运动学都是必不可少的组成部分。为了增强机器人的灵活性
近些年TOP500的报告显示,集群所占的比例越来越大,集群系统已成为高性能计算的主流平台。随着处理器硬件的日益成熟和高速网络的发展,集群已经广泛而深入地应用到工业界。集
随着经济、社会生活持续快速的发展,环境污染、生态恶化与能源短缺问题也日趋严重。新能源的开发与使用,为生产、生活中缓解了能源供需紧张的压力,但是能源的浪费,不合理利用
随着互联网的迅速发展,Web资源急剧膨胀,目前已成为最重要的网络资源。Web资源管理的主要目的是让人们准确、迅速的从多而杂的Web资源中找到感兴趣的信息,将大量无序的信息提
随着云计算的兴起和发展,各大IT巨头纷纷构造自己的云服务。其优点是依托强大的计算能力,云端可提供的资源服务种类日益增长。人们不必在意自己的机器配置,自己的计算机是否
路径搜索是计算机游戏中的一个基本问题,它的效率主要取决于需要探测的节点数目。A*算法探测的节点数目随着搜索空间的增大而增大,难以在游戏的实时性、计算机资源有限等诸多