面向社会工程学的SNS分析和挖掘

被引量 : 0次 | 上传用户:klyx808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的兴起,互联网发展出了多种多样的网络应用服务,其中“社交网络服务(Social Network Service,SNS)”是近年来最为火爆的网络应用。用户在平台上分享和获取着海量数据的同时,也把自己暴露在社会工程学攻击的威胁中。本文以社会工程学为导向,研究提出并实现了一种通过分析与挖掘SNS用户数据从而挖掘用户隐私的方法和技术。该方法基于社会工程学理论,从多SNS源搜集用户的社交活动数据,借助社交主题模型、社交网络图和可视化等技术,对SNS数据进行分析、挖掘和显示。该研究可用于协助SNS网站制定隐私控制策略,在提高用户网络安全等方面都会有重要的意义。本文首先分析了SNS数据分析挖掘技术和社会工程学研究的国内外现状,然后结合本文的研究目标,重点研究了面向社会工程学的SNS分析和挖掘的三个关键技术:1)多源SNS数据的分析抓取。本文分析了各社交网络的隐私控制策略,在此基础上对可抓取数据进行了归纳和总结,提出了多源数据抓取的技术框架,同时针对任务实时性的需求,设计了基于社交活动预测的任务调度算法。2)基于LDA的自适应社交主题模型。为了分析和挖掘用户的社交主题,本文针对用户社交平台的动态数据,提出了改进的LDA社交主题模型,该模型使用了新的相似度评价标准,可以自适应地解决用户社交数据LDA建模中主题数K无法确定的难题。3)隐私挖掘途径研究。基于社会网理论,结合社交主题模型对用户静态关系网进行了深入分析,研究并给出了与目标用户建立弱连接关系的途径分析。接着,在上述三个关键技术的基础上,结合上海某公安研究所的实际需求,采用基于UML的面向对象开发方法,完成了SNS用户隐私分析和挖掘平台的用例建模和架构设计,并使用MySql、J2EE、JGibbLDA和Restful等相关技术实现了该隐私分析和挖掘平台。最后,针对本文所提出的多源SNS数据的分析抓取、基于LDA的自适应社交主题模型和隐私挖掘途径的三项关键技术分别设计和完成了实验,实验结果显示上述研究都是可行的。目前SNS用户隐私分析和挖掘平台已经在实际中交付该研究所试用,实践也表明平台的功能、性能和挖掘办法都满足了该所的使用需要。
其他文献
在广告中建立与受众持久稳定的关系决定了广告效力的实现程度,同质化的时代下,受众不仅仅只追求本能层次和行为层次购买需求的满足,更叠加了对反思意识层次的需求,片面的强调
铃木教学法,是音乐教育领域很有影响力的教育法。尤其在器乐教学中,当今世界上多个国家皆采用铃木教学法进行音乐的启蒙教学,因而得到了广泛的推广与运用。笔者在学习、借鉴
文学是人学的承载与表达,西方文学的发展道路体现了西方社会从远古走到今天的人学的进步历程。在西方社会传统的文学领域,“神话英雄”以及它所代表的意义居于主导地位,统领着文
移动通信的网络质量越来越受到关注,运营商对网络性能指标的稳定性要求越来越高,尤其是涉及到用户感知的指标,例如寻呼成功率、接通率、掉话率等,都提出了很高的要求。文章对影响
李斯是與秦朝歷史有著密切關係的政治家,也是頗具爭議的歷史人物。他輔佐秦始皇建立了我國歷史上第一個統一的中央集權封建國家,制定和完善了一系列鞏固統治的政治、經濟措施
会议
中华民族伟大复兴需要良好的国际环境。中日关系目前由于钓鱼岛争端而处于僵持和困难局面,不利于中国健康平稳和快速发展。本文介绍笔者及其团队近年来组织的中日关系调研对
量刑程序改革五年来,量刑证明的实践效果堪忧,表现在重量刑建议轻量刑程序、量刑事实及量刑证据稀缺、量刑证明规则模糊等方面,重定罪轻量刑的现象仍很严重。《刑事诉讼法》
经历了80年代初期文学中对“文革”的回忆与反思后,随着国家改革开放的步伐和政治、文化思想的进一步解放,以及对文艺领域的领导和控制的进一步松动和西方文化思想热潮的兴起及
本文以两个在可溶性糖和淀粉含量上存在显著差异的鲜食型甘薯品种为材料,对其块根中的可溶性糖(蔗糖、葡萄糖和果糖)和淀粉含量以及四种蔗糖分解酶的活性进行测定与相关性分析,以
冰川的物质平衡是指一段时间内冰川的收入和支出量。冰川物质平衡是水热等气候因素对冰川综合作用的结果,其动态变化直接影响到冰川规模和径流变化。冰川的物质平衡是联结冰川