基于百度新闻的城市社会风险感知

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:pingerk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不同地域不同时间范围的社会风险感知对于社会风险管理具有重要意义。20世纪90年代,钱学森指出社会是一个特殊的开放复杂巨系统,从定性到定量的综合集成方法与技术的提出正是用来解决社会复杂问题。基于传统的研究方法无法及时有效的对不同地域的社会风险进行研究,本文通过获取互联网城市新闻对城市社会风险进行研究,大大降低了数据收集成本。  本文针对不同地域不同时间范围的社会风险进行研究,综合使用网络爬虫、文本挖掘、网络分析和数据可视化技术对城市社会风险的时空特性进行研究。本文主要研究内容包括:  1.构建城市社会风险感知系统。通过编制网络爬虫每日定时获取302个城市的新闻,通过对新闻进行风险类别判断、关键词提取和话题推断构建新闻画像,基于每个城市的新闻计算城市风险水平、每日最热风险关键词和每日最热风险话题,并通过邮件推送和网页展示两种方式呈现给研究人员。  2.分析城市新闻社会风险判别策略的可行性。分别使用已标注的“百度热搜新闻词”相关新闻和人工标注的部分城市新闻两种不同来源的新闻数据作为训练集和测试集,对分类的可行性进行分析。最终分类精度保证在0.8以上,说明了通过“百度热搜新闻词”新闻对城市新闻进行分类的可行性。  3.基于城市风险新闻构建城市风险画像。通过城市新闻提取城市风险关键词,基于“新闻-风险关键词”2模网络研究最突出的风险关键词,通过“风险关键词”网络的聚类研究不同簇中风险关键词特点,并对具有同一个风险关键词的新闻进行文本聚类从而对风险事件进行分析;通过对有风险新闻进行话题提取,计算城市在每个风险话题上的热度,从而对城市最热话题和城市在同一话题下的分布进行研究。  4.时间维度上城市社会风险的研究。根据每个城市在不同时间范围内有风险新闻所占比例计算城市风险水平,从而进行城市风险水平排名;研究城市每日最热风险关键词和风险关键词热度变化,并对城市风险话题的热度变化进行研究。
其他文献
清源问:rn“双11”又快到了,我虽然没多少零用钱,但总是忍不住想买买买.而且随着支付宝、微信等电子支付方式的畅通,我更是感觉自己花钱如流水.我特别想问在移动支付时代,应
期刊
期刊
2003年11月7日,中国古琴艺术被联合国教科文组织列为第二批“人类口述和非物质文化遗产代表作”,成为中国第二个入选项目;15年后的今天,一位老人正为制作世界上最好的古琴而
期刊
今年8月,本刊记者就目击了一场年度饭圈盛事.rn记者手记:rnTFBOYS五周年演唱会的一天rn时间:7:30 地点:北京工人体育馆北门rn8月24日是举办TFBOYS五周年演唱会的日子,坐了一
期刊
小时候,一次不经意间从药品柜前走过,我突然惊奇地发现外形和大小类似的药片居然有多种不同的价格,从几块钱一片到上万元一片不等.我停在药品柜前,睁大眼睛看了很久,一粒粒药
期刊
原油既是世界上最重要的能源,也是最重要的商品之一,其价格变动对国际政治经济形势具有重要影响。深入分析国际原油价格波动特点,提高国际原油价格预测准确性,对国家经济发展和安
第一种,无是非型。此指那种在解决下属之间的争端时,不分是非曲直而各打五十大板的领导。下属之间的争端多属是非之争,领导若将此定性为闹不团结或是“窝里斗”、“搞内耗”
“我有一种神奇的潜质”rn记:当初为什么会想到参加《最强大脑》这个节目呢?rn杨:我是《最强大脑》的粉丝,前几季节目我一直在看,总觉得自己有一种神奇的潜质,可以尝试参加这
期刊