论文部分内容阅读
国土部门需要通过网络舆情监控了解制度改革民意,及时解决和控制社会矛盾,推进不动产相关工作的稳步推进。通用的舆情采集与分析方法针对较小主题类型的舆情信息不具有较好效果,如何快速准确的获取不动产舆情信息,如何多元化分析不动产舆情信息是解决相关政府部门舆情管控问题的关键所在。本文针对互联网空间中的新闻网站、微博贴吧等平台上的新闻与评论信息,从时间、空间、主题三个角度,研究不动产舆情信息的获取、解析和多元化分析方法,进而为国土部门提供决策支持。本文的主要研究内容和结论包括以下几个方面:(1)不动产舆情信息表达模型分析不动产舆情信息的基本描述特征,提出了不动产舆情信息分类体系;分析了不动产舆情信息的内容要素及其文本描述特点,总结了网络舆情内容六要素,提出了不动产舆情信息表达模型。(2)时空与主题约束的不动产舆情信息获取从不同类型不动产实体的通用主题出发,借助词语关联度计算方法,构建不动产舆情主题层次模型;结合时间模式与地名区域词典,通过多种采集方法进行不动产舆情信息获取;参考自然语言文本信息抽取方法,结合舆情信息描述特征对相关方法进行改进,抽取了不动产舆情信息的内容要素。(3)不动产舆情时空与主题分析方法在地名空间化、日期序列化的基础上,基于时间、空间与主题三个不同维度,对不动产舆情进行了多元化分析。在传统主题热点分析与情感倾向分析的基础上,总结了不动产舆情信息的时空分布规律,刻画了不同时空区间本身的主题语义特征,分析了不同时空范围在语义空间中的关联性。以云南省不动产数据为案例,对相关方法进行了验证,研发了原型系统并在国土部门不动产云平台上进行了测试与应用。研究结果表明,在充分考虑网络舆情信息特征的基础上,不动产舆情信息表达模型能较好的实现信息的管理与存储;基于时空与主题约束的舆情信息采集方法能够有效、准确地检索并获取主题范围较小的特定领域的网络舆情信息;改进和优化的信息抽取方法能较好的完成不动产舆情信息的要素抽取,形成结构化的舆情信息;不动产时空与主题分析方法能够较准确的分析给定舆情主题、时空范围下的热点话题、情感倾向、舆情时空分布以及不同时空区间的语义关联性。