【摘 要】
:
随着互联网的发展,网络平台逐渐成为公众表达意见和抒发情感的主要阵地,网络舆情也随之成为社会舆情的主要成分。文本作为网络信息最主要的载体之一,是网络舆情挖掘的主要内容来源。在当今网络文本大量产生并快速传播的背景下,网络舆情进入了概念细分的新阶段,网络舆情特征挖掘及可视化技术是实现对舆情分类分级的重要手段。对于大规模的网络文本,从语义层面对其进行主题挖掘,并构建层次关系,是对舆情分级分类的解决方法之一
论文部分内容阅读
随着互联网的发展,网络平台逐渐成为公众表达意见和抒发情感的主要阵地,网络舆情也随之成为社会舆情的主要成分。文本作为网络信息最主要的载体之一,是网络舆情挖掘的主要内容来源。在当今网络文本大量产生并快速传播的背景下,网络舆情进入了概念细分的新阶段,网络舆情特征挖掘及可视化技术是实现对舆情分类分级的重要手段。对于大规模的网络文本,从语义层面对其进行主题挖掘,并构建层次关系,是对舆情分级分类的解决方法之一。本文在利用层次主题模型挖掘主题的层次结构的基础上,结合情感分析方法,生成具有情感属性的层次主题数据,作为网络舆情特征数据。之后从模式驱动设计的角度出发,为网络舆情数据设计了基于藤蔓样式的隐喻可视化方案,并将可视化方法应用到不同的数据集上。因此本文的主要研究内容是在对层次主题模型研究的基础上,挖掘带有层次主题关系和情感属性的网络舆情特征数据,并针对性地提出了一种基于隐喻设计的可视化方法。首先,针对网络文本,从语义层面对文本集分别进行了层次主题挖掘和情感向量识别的工作,在层次主题挖掘中,基于层次潜在狄利克雷分配模型,对抽样文本集设计实验,研究模型参数对层次主题生成的影响,并设计评估函数对实验结果进行分析;之后使用情感词典对文本识别情感向量,根据层次主题结构计算获得各层节点的情感属性值,从而实现对网络舆情数据特征的挖掘。其次,本文从模式设计的概念出发,结合网络舆情数据的特点,设计了一种基于藤蔓隐喻的可视化方法,将数据映射到藤蔓设计的元素上,利用数据驱动藤蔓的生长,针对藤蔓的生长模式提出了布局优化策略,并定义了对应的节点坐标生成算法;之后为验证可视化的有效性和模式识别能力,将方法运用到不同种类的数据集上进行案例分析;此外,还对可视化从用户使用、时间性能和空间利用率多方面做了评估实验以验证其可用性。最后,为了满足用户的分析需求,本文实现了一个网络舆情数据分析可视系统。将藤蔓隐喻可视化作为主要视图,增加了多个辅助分析视图,方便用户交互性地对可视化结果进行分析;另外对用户开放绘制面板实现对可视化绘制效果的调整,提升用户对网络舆情数据特征的对比分析体验。
其他文献
目前,水体中存在的四环素类有机污染物和六价铬等重金属离子已对生态系统造成威胁。光催化技术由于其存在无污染及可持续发展等优点,且可以有效降解四环素(TC)和还原六价铬Cr(Ⅵ),因此受到了研究者的广泛关注。目前,在评估四环素(TC)降解及Cr(Ⅵ)还原效率的众多方法中,通常使用紫外可见分光光度法(UV-vis)对降解程度进行分析。然而,对于一些无色重金属离子及无色有毒产物,UV-vis并不能准确分析
20世纪90年代,由于民族文学创作环境趋暖,叶广芩一系列极具特色的满族家族小说相继问世,引起文坛关注。她的家族小说全方位展现了贵族世家的兴衰变迁,既以亲历者的身份将昔日家族兴衰述说得哀婉动人,又以旁观者身份毫不留情地揭露大家族制度与文化的腐朽落后。进入新世纪以后,商业化浪潮席卷之下的社会群体产生精神变异,叶广芩立足当下回望旧园,在对比中继承传统文化精髓,力求为精神变异的民族个体重塑民族精神。她经历
当肝脏受到慢性肝病等造成的持续损伤时,肝脏会发生愈伤反应,此时肝脏内细胞外基质将持续沉积,上述过程称为肝纤维化。肝纤维化若得不到及时有效的治疗则会逐渐恶化发展为肝硬化甚至肝细胞癌。定量磁化率成像可探测细胞外基质中胶原蛋白的沉积量,因此有可能可以反映肝纤维化的程度。另一方面,虽然定量磁化率成像技术在头部的应用已趋于稳健,但其在腹部的重建过程仍充满挑战。本文针对定量磁化率成像技术分期肝纤维化中的技术挑
直肠癌(Colorectal Cancer,CRC)也被称为碗癌,是世界范围内导致死亡的主要原因之一,早期诊断已成为成功治疗的关键。随着卷积神经网络(CNN)的新进展,可以将不同的CRC图像分成不同的类别,确定该CRC图像的组织特性,指导医生进行病理诊断。由于医生手动分类耗时且容易误判,使用深度学习对CRC图形进行自动分类变得尤为重要。本论文将使用神经网络对CRC图像进行学习训练,实现高精度高准确
颈动脉具有十分重要的生理作用,临床上一般通过比对颈动脉内中膜厚度(CIMT)是否处于标准范围来判断颈动脉斑块的产生与否。CIMT是指颈动脉血管腔内壁至血管外部与其他生理结构之间外壁的距离,通常采用血管超声进行检查。受限于超声成像的特点,血管超声往往会受到患者体位、血液流速以及医生从业经验等多方面因素的影响,而且超声图像本身会包含大量的噪声,在包含大量噪声的超声图像中准确分辨本就很难识别的血管内中膜
马赫-曾德尔干涉仪与SU(1.1)干涉仪,是当前精密测量领域中主流研究的两类干涉仪,两者均存在一定的优缺点。马赫-曾德尔干涉仪在采用经典光源(相干光)时相位灵敏度无法突破标准量子极限(Standard quantum limit,SQL):(?),其中代表干涉仪中的光子数。SU(1.1)干涉仪虽然相位灵敏度可以突破SQL,但受限于仪器条件无法容纳较大的光子数,导致绝对相位灵敏度不高。为此结合这两类
太极拳(TaiChiChuan,TCC)是一种集优美,正念和温柔于一体的传统中国运动,练习太极拳对认知能力、运动功能,如姿势控制,预防跌倒,提高肌肉力量等方面皆有益处。现阶段采用先进的神经影像学技术对太极拳运动的脑作用机制研究不多,尤其对于太极拳学习过程中脑可塑性的变化了解更少。本研究为前瞻性研究,采用被试内设计,分别从功能分离和整合两个角度出发,基于局部一致性(regional homogene
可分组设计在组合设计中占有很重要的地位,它在构造其他各类设计中有着相当广泛的应用.关于组型为gtul的3-GDD,C.J.Colbourn,D.G.Hoffman,和R.Rees已经证明了λ=1时,其组型为gtul的3-GDD存在的充要条件.本文将证明λ≥2时,组型为gtul的(3,λ)-GDD存在的充要条件.本论文内容由下面四个部分构成:第一章简要介绍了组合设计的一些基本概念,并给出了组型为gt