【摘 要】
:
本文通过挖掘网络搜索数据与我国流感疫情的在内在机理,利用关键词的时序特征实现了较为精准的提前预测。研究首先从信息行为、信息搜寻行为等理论概念出发,对百度指数与流感
【机 构】
:
北京大学信息管理系,北京大学海洋研究院
论文部分内容阅读
本文通过挖掘网络搜索数据与我国流感疫情的在内在机理,利用关键词的时序特征实现了较为精准的提前预测。研究首先从信息行为、信息搜寻行为等理论概念出发,对百度指数与流感病例数据之间的逻辑关系进行探讨,建立理论框架;然后以理论框架为基础,用范围选词法对百度搜索词进行初步筛选,并利用互相关分析选出具有先行性质的关键词,用于构建预测模型;最后,对比融合百度指数的三种预测模型,评估其预测效果。互相关分析结果大致符合本文提出的逻辑框架,可提前十周预测流感疫情的关键词内容和流感疫苗相关;提前一周的关键词多涉及流感的症状表现;而同步类关键词多为常用搜索词或治疗方法。模型对比结果显示,多元线性回归模型、支持向量机模型和神经网络模型都能有效地进行流感预测,无论提前十周还是提前一周,支持向量机的效果最好。
其他文献
谷氨酸是工业发酵领域重要的氨基酸之一,由于菌种开发技术较为落后,使得谷氨酸产生菌的产酸率低。其中技术难度最高的是改变菌株特性,如何通过诱变技术使产酸率提高是目前该
本文系统综述了科学计量学中多源数据融合的研究和应用现状,将科学计量中多源数据融合划分为前期融合、中期融合和后期融合,并重点分析了多数据类型关系的获取与融合实现方法
本文广泛调研了2000年以来的国外点击流数据可视化研究,针对文献中点击流可视化视图的视觉特征开展了细致的分析与比较并发现:已有的可视化在视觉表示上一般以用户的访问足迹
国家教育事业发展“十三五”规划指出,以创新、协调、绿色、开放、共享的发展理念统领教育改革发展,围绕深化产教融合、校企合作、工学结合主线,改善基本办学和实习实训条件,
提出了一种用微机电系统技术(MEMS)应变传感器阵列探头客观细腻地采集人体脉象的新思路.探头采用直接腐蚀出电阻条的技术,具有工艺简单、成本低廉、电阻变化率高、工作可靠等
旨在提供一种表计分析与改造思路,增强表计计量的准确度,使供水企业与用水户之间的利益关系透明化以及提高社会效益。以水平衡分析为基础,从表观漏损水量入手,联合供水管网分
引起羊鼻蝇蛆病的羊狂蝇(Oestrus ovis)是一种寄生性昆虫,有关其神经活动和行为生理方面的研究报道甚少,尤其是羊狂蝇趋性和生物钟的研究更无文献报告.本试验采用昆虫学的试