论文部分内容阅读
随着互联网的快速发展,越来越多的人把互联网作为获取信息的主要渠道。社交媒体也凭借互联网这一优势迅速崛起,成为了人们进行交流、分享的网络平台。而微博凭借其传播速度快,操作简单,实时分享,互动性强等特点成为了社交媒体的首选。目前流行的微博营销成为了商家之间的新宠,但是营销方式却停留在以官方账号为中心的营销方式上。商家通过发布微博的形式发布广告,但由于观念误区多、用户需求不清和拟定营销任务不合理等问题,往往使得商家的营销效果不理想。针对以上存在的问题,微博精准营销平台结合了微博平台和网络营销的特点,设定了智能推荐传播员模块。该模块主要包括微博话题发现和微博转发预测两个部分的研究内容。然而,由于新浪微博的内容属于短文本,特征稀疏,甚至包括影响微博转发的问题,给传播员的智能推荐增加了难度。针对微博的话题发现问题,论文采用改进的SOM神经网络进行聚类。首先针对微博特征稀疏问题,论文对微博文本进行特征提取,然后构建特征向量,该方法同时也可以解决聚类过程中的维度过高问题,最后,采用基于SOM聚类的方法进行发现话题。实验表明,采用改进的SOM神经网络进行话题发现的综合指标F值比传统的话题发现方法平均提高了约6.2%。针对微博的转发预测问题,论文对影响微博转发的因素进行了分析。论文将影响微博转发的因素分为了两大类:微博的用户属性和文本特征。提出了基于Logistic Regression模型的方法实现对信息的转发预测。通过对用户属性和微博特征进行分析,以不同的微博特征作为Logistic Regression模型的输入,从而预测出转发的结果。实验表明,该算法的综合指标F值较传统的分类方法平均提高了约4.5%。最后,根据上述的理论方法对微博精准营销平台进行设计,该平台以智能为商家推荐传播员为目的,设计出了传播员智能推荐子系统,为平台进行了可视化展示。