论文部分内容阅读
随着互联网的发展,信息传播越来越普及,网络言论更加自由。网络论坛已经成为人们发表观点的重要平台。论坛管理人员需要利用有效的技术,对论坛的信息进行管理,能对海量、无序、分散的论坛数据进行有效的组织,可以对论坛中的热点话题进行发现,并且在此基础上能够有效追踪话题的发展动态,为相关部门及时了解话题发展动态并且采取相应的措施提供了必要的手段。本文在话题发现的基础上研究了对话题关注度变化趋势的预测。第一,本文将从网络论坛得到的主题信息用特征向量的形式进行表示,并利用聚类的方法对这些向量集合进行聚类得到话题簇,并对得到的话题簇进行过滤。第二,在得到的话题簇的基础上,对其包括的主题信息的历史数据进行分析,由话题的发展趋势特征,构建马尔可夫链,根据马尔可夫预测模型对其定性分析;第三,由于每个论坛的用户活跃时间都不同,话题在单个论坛的发展趋势有着共性,分析影响论坛中的话题发展趋势的因素,确定系统状态,构建马尔可夫过程,用强化学习来解决各个状态下的最优预测值,根据话题在论坛中所处的状态,定量的预测它在下一段时间内变化值。