领域知识在旅游网络舆情分析中的应用研究

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:hua50776007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们生活质量的不断提高,旅游行业迅速崛起,在国民经济中占据着举足轻重的地位。云南省顺应时代的发展,在当前的发展优势下紧紧抓住这个机遇,大力发展旅游业,现已成为国内外知名的旅游胜地。信息技术随着经济的发展而进步,互联网技术的快速发展和智能手机的普及导致使用社交软件的门槛越来越低,各大社交网站已经成为了各种有关云南旅游声音汇聚的重要场所。众多网民针对网络旅游话题所持有的代表性意见随着网络舆论对旅游业影响力的不断提升而扩大,在这种局势下,微博以其简单方便快捷的优点迅速成为人们感兴趣的平台,渐渐成为旅游网络舆情的主要传播途径之一。为了长期维护云南旅游业的安全稳定和健康发展,发现微博上的云南旅游热点话题并对旅游网络舆情的演化趋势进行分析预测具有重大的现实意义。本文研究的主要内容是:如何将网民们关注的旅游热点话题从复杂的、分散的网络数据中提取出来;如何解析提取出来的旅游热点话题的信息,并以此来分析该话题的演化趋势。目前发现网络热点话题的大多数研究方法都是通过文本挖掘技术解释信息内容,并发现这些信息之间的关系,进而挖掘出虚拟网络中的网民们关注的热点话题,但是效果都不是很理想,尤其在不同的领域,同样的挖掘方法得到的结果却不如人意。本文根据现在研究的不足,针对具体领域构建领域本体,并将该领域本体应用在舆情分析中的数据处理、文本建模和话题聚类等过程中,从而发现人们关注度高的话题,最后按照人们对话题关注的热度为话题排序,从而得到热点话题。在此基础上,综合其他学科的相关理论来分析热点话题的形成机制和演化特点来预测热点话题的演化趋势。本文在研究中所做的创新性工作如下:(1)基于云南旅游这个具体的领域构建领域本体。(2)在深入研究特征提取算法的基础上,提出一种基于领域本体的特征提取算法。该方法融合领域本体与TF-IDF方法,对本体推理从而优化特征抽取,用改进过的TF-IDF公式来计算特征词的权重。利用传统算法和改进后的算法进行实验,实验结果对比表明了该优化算法提高了特征抽取的正确率,证明了它是一种有效提取特征的方法。(3)依据微博评论数、点赞数和转发数三者的调和数对旅游话题的热度进行评定,按照评估值对话题排序,将排序的结果与微博官方公布的排行进行比对,从而验证了该评估法的有效性。
其他文献
相对于我国古代先进的建筑技术成就,我国在古建筑的计算机建模还比较落后,急需利用现代信息技术手段,对古建筑的保护和开发进行探索和研究。本文选取唐朝风格的古建筑(简称古
集成聚类技术由于具有较好的泛化能力,已引起了研究者的高度关注。目前,在集成聚类领域已经取得一些显著成果,针对不同的应用需求提出了不同的集成聚类算法。然而,已有算法能够处
巡回旅行商问题(TSP)是一个组合优化方面的问题,已经成为测试组合优化新算法的标准问题。从理论上讲,使用穷举法不但可以求解TSP问题,而且还可以求出该问题的最优解。但是对现有的
随着互联网的不断普及和各种图像采集设备的持续发展,图像作为人类感知世界的重要信息源,在实际中的应用也变得更为重要。如何从海量的数字图像集合中快速查找目标图像,是研究的
随着计算机通信技术、微电子技术和传感技术的发展,无线传感器网络应运而生。无线传感器网络作为一门新兴的、多学科的前沿性技术,集成了多种先进技术与理念,将虚拟的信息世界与
群体现象在自然界中普遍存在,如南迁的鸟群,水中的鱼群,人群等等。群体仿真近年来逐步成为虚拟现实领域的研究热点,并且普遍应用于实时仿真和虚拟娱乐领域。群体仿真的主要目的是
随着信息技术的高速发展,特别是人类社会进入互联网时代,海量的数据信息随之产生出来。一方面人们得以享受到以往任何时代都无法想象的信息资源,但另一方面,针对这些海量的有价值
生物信息学是一门结合了生物学、计算机科学、数学和化学等领域知识的交叉学科。随着科技的飞速发展,基因测序技术的研究取得了重大突破,人们逐渐开始对基因的功能和内在机理
微粒群优化算法是一种群体智能算法,该算法在迭代初期容易出现早熟,迭代后期可能会出现振荡μ等现象,算法的收敛速度也较慢。针对这些不足,本文对微粒群优化算法进行了深入的分析
细分曲面长期以来一直都是计算机图形学的经典研究方向,伴随着几十年的发展,且其研究成果已经被广泛地应用于制造业、游戏、娱乐以及电影工业等领域。细分曲面的结果通常都是很