基于蚁群算法的热点话题

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:xq111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
话题发现和跟踪(TDT)技术是国内外研究的一个热点,具有广泛的应用前景。本课题的研究目标是设计和实现一个热点话题发现系统模型,应用一种新的仿生物学的聚类算法——蚁群聚类算法作为发现算法,发现新闻中的热点话题,使用户能够阅读自己感兴趣的话题。   本文首先介绍了话题发现技术和它的研究现状,总结出话题发现技术实际上等同于无指导的聚类研究,然后对蚁群算法的发展做了简要介绍。   接着,本文阐述了和本研究相关的技术,主要介绍了文本预处理技术和聚类方法,总结了它们的常用技术,并分析了这些技术的优缺点。   然后,本文梳理了蚁群聚类算法的发展历史和基本原理,介绍了两个经典蚁群算法,分别给出了它们的数学模型。我们针对热点话题发现的特点和标准蚁群聚类算法的缺点,提出了对标准蚁群聚类算法的改进策略:为蚂蚁增加了“记忆”功能;引入了多种群的蚂蚁;防止算法过早停滞;优化蚂蚁的移动策略。实验结果表明,改进后的算法较基于标准蚁群聚类算法具有更高的准确率。   本文最后完成了一个热点话题发现系统模型,使用利用RSS技术的爬虫从网络中抓取文本,并对文本进行一系列的预处理,利用改进的蚁群聚类算法发现热点话题,并将之排序并提取出话题名称。对该模型进行的实验表明,它能够自动发现网络新闻中的热点话题,这样它就能够取代人工操作,节省人力资源。
其他文献
知识经济时代,培养学生的创新能力与问题解决能力是新一轮课程改革的目标。作为一种运用信息技术进行创新学习的理论,“知识建构(Knowledge Building)"经历20多年的发展,其理
教育在社会发展中处于优先发展的战略地位,而教师是保证教育质量的首要条件,是决定教育事业改革和发展的关键。高质量的师资队伍依赖于有效的教师教育,而教师培训是在职教师专业
无处不在的网络、无处不在的通讯和堆积如山的文档,构成了当今社会信息爆炸的基本特征。BBS是目前最流行的网上讨论场所之一,越来越受到网络用户的欢迎。因此,在Web论坛上会产生
知识建构学习的工具——知识论坛(KnowledgeForum),其中学习支架(scaffoldings)是其核心功能之一。搭建一定的学习支架是支撑和辅助学生有效地进行知识建构学习的重要保证,学生在
教育与教学的本质问题是教育领域中的重要问题,而在具体的教育教学实践中其本质也极易被人们所忽视,教育教学在去教育化去人性化的过程中逐渐偏离了教育的本质,呈现出错位状态。