基于时间序列的在线问答社区UGC发布数量预测研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lhfheihei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联技术的普及使得用户生成内容(User Generated Content,UGC)近年来发展迅速,实现了各个领域各个方向的覆盖。在此背景下,用户原创内容的载体——在线UGC社区也不断演变发展趋向成熟。在线问答社区是伴随UGC模式由传统问答平台演变而来的一种新型在线社区,是一种典型的UGC衍生应用。对于在线问答社区而言,UGC内容发布行为是社区用户活跃的直接体现与表征。分析挖掘社区用户活跃规律、激励用户创作UGC内容对于平台运营举足轻重。评估与预测用户UGC发布内容的数量与质量是辅助社区运营管理的关键工作之一。本文的研究旨在构建一种相对更优的预测策略,提高预测的效率与精度。本文建立了基于时间序列的UGC数量预测模型,并利用大型在线问答社区知乎中的部分用户数据进行了测试,获得了较高的预测精度。首先,本文根据UGC数量预测问题本身的特点,从理论层面与应用层面分析了预测策略的适用性与局限性,并选取了时间序列方法作为主要预测手段。同时,本文通过分析在线问答社区的特征并结合过去的研究结果,把在线问答社区用户的UGC内容产出归结为一种知识贡献行为。在总结过去通过隐马尔科夫模型模拟知识贡献意愿的研究的基础上,本文提出使用隐马尔科夫模型挖掘此类时间序列的更多特征预测UGC发布数量。最后,本文结合将时间序列转化为监督序列的思想,利用非线性集成学习模型XGBoost预测UGC发布数量。与传统时间序列分析方法(差分自回归移动平均模型)的预测结果进行对比,本文提出的方法获得了预测精度和效率的提升。
其他文献
手性环氧氯丙烷(ECH)是一种重要的C3手性合成子,被广泛应用于β-肾上腺素阻断药物阿替洛尔和噻吗洛尔、阿伐他汀侧链关键中间体(S)-4-氯-3-羟基丁酸乙酯、减肥药左旋肉碱和麻醉剂
Dlk1-Dio3印记区间是基因组中重要的印记基因簇之一,位于小鼠的12号染色体的末端。该印记区间为重要的表观遗传调控区,内部存在3个父本表达蛋白编码基因,及多个母本表达的非
改革开放四十年来,我国经济在保持快速增长的同时,也消耗了大量的能源。而在我国消耗的能源当中,煤炭所占比重最大。这使得我国煤炭贸易企业的利润一度令其它行业所羡慕。但
绩效考核就是运用相关的标准,对员工在企业中的行为和业绩进行评估,并科学运用评估结果实现对员工行为进行引导的过程和方法。绩效考核是现代企业管理的重要环节,也是调动员
林木生物质快速热解油可再生、氮硫含量低、污染小,具有替代传统化石燃料用于生物燃油的潜质。但热解油高含氧量、低热值、强酸性以及不稳定性,阻碍了热解油作为燃料的工业化应用。本论文以降低热解油含氧量、提高热解油品质为目标,采用催化加氢对热解油进行提质改性。以此设计了本研究催化加氢所用反应釜和催化加氢实验台,考察了不同催化剂和催化加氢工艺条件对催化加氢产物的影响,获得了催化加氢制备供热用生物燃油的合适工艺
琼胶是由琼脂糖和琼脂胶组成的海藻多糖,在生化、临床、医药、食品等领域应用广泛。利用琼胶酶降解琼胶后获得的琼胶寡糖具有抗氧化、减缓淀粉水解、易于人体吸收等药理作用
X射线脉冲星能够为航天器提供高精度的位置、速度、时间等导航信息,可以用于实现航天器自主导航和自主运行管理,有巨大的发展前景与潜力。为了进行X射线脉冲星导航的关键技术
碳载金属纳米颗粒催化剂因其在一系列重要的催化反应(如电催化氧还原、电催化小分子氧化、以及各类加氢/脱氢反应等)中具有优异的活性和选择性,而受到广泛关注和研究。然而传
控股股东股权质押在我国资本市场普遍存在,控股股东通过质押上市公司股票,可以以较低的成本快速获取所需资金。然而,股权质押在为控股股东提供方便快捷的融资渠道的同时,也悄
近年来,量子信息处理技术已经逐渐从理论走向实验,并且可行性大大提高。但由于线性光学方法线路非常复杂,构建难度大,成功率较低,只依赖这种方法完成量子信息处理任务,如量子