论文部分内容阅读
智能手机的不断增加,带来了移动社交的普及。同时由于智能手机上多源化交互方式的流行,使得云端积累了大量的移动社交数据。通过这些多源化的社交数据可以对于社会网络进行有效的分析。对于社会网络的分析研究属于社会网络分析研究领域的范畴,进行社会网络分析的首要目标是分析社会网络中的关系情况。社会网络关系的研究点有很多,其中关系强度的测量工作是其他研究工作的基础。怎样通过获取到的多源移动数据对社会网络关系进行强度测量成为当前研究的热点和难点。本文围绕着上述问题在充分分析当前社会网络、社会网络关系强度以及移动社会网络关系研究现状的基础上展开研究。重点描述了移动社会网络关系数据获取、移动社会网络数据处理及移动社会网络关系强度测量三个方面的相关技术。进而以移动社会网络为背景,重点研究了多源移动数据的处理与分析,并在该工作的基础,针对多源社会网络关系强度聚合测量这一研究点展开了深入研究。本文的工作主要体现在以下三个方面:1)针对当前多源移动社会网络分析中数据类型多、处理复杂、效率低下等问题,提出了一个多源移动社会网络分析模型处理多源移动数据和分析社会网络。具体来说,提出的基于代理的多源移动数据处理机制用以对多源移动数据进行有效处理,提出的基于Networkx的多源可视化机制用以实现多源社会网络可视化。针对代理中异常数据种类繁多,处理复杂问题,提出了基于规则的多源异常数据处理机制。2)以多源移动关系强度聚合测量研究问题为背景,针对单源关系强度测量算法不能对多源关系强度进行测量这一问题,提出了基于线性回归模型的多源聚合测量算法。算法通过构造一个多元线性回归的多源关系聚合模型对关系强度进行有效计算,该模型基于机器学习方法训练而成,所需要的训练集数据来源于15名招募的志愿者贡献的一个月移动数据。训练得到的模型可以显示不同数据源对于关系强度的影响比重,动态计算关系强度,且针对多源数据的输入具有很好的扩展性。3)以多源移动社会网络分析架构为基础,实现了一个原型系统进行了原型展示,并在此基础上验证了课题提出的多源移动关系聚合测量算法。原型系统的移动端基于Ubiqlog开源软件实现,服务端数据处理与算法实现基于Python语言编码完成。实验验证部分多角度分析了采集的数据,对算法进行了验证与评估。