随机森林对文本情感分析的应用与R软件实现

来源 :现代预防医学 | 被引量 : 0次 | 上传用户：songyong

【摘要】

：

目的文本数据与日俱增,但较少应用于公共卫生领域。本文旨在阐述如何通过随机森林和R软件实现文本情感分析,提供方法学参考。方法人工标注文本情感类别,然后进行分词、特征词

【作者】

：

郑志伟邱佳玲阳庆玲龚晓春郭山清贾忠伟

【出处】

：

现代预防医学

【发表日期】

：

2018年08期

【关键词】

：

随机森林文本情感分析 R

【基金项目】

：

国家自然科学基金委重大研究计划"大数据驱动的管理与决策研究"重点项目资助,91546203,基于大数据的MSM艾滋病管理和决策范式研究;国家自然科学基金,基于人际依赖理论的男男性接触者伴侣艾滋病高危性行为研究,81502854;广州市科技计划项目科学研究专项,201504291407178

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目的文本数据与日俱增,但较少应用于公共卫生领域。本文旨在阐述如何通过随机森林和R软件实现文本情感分析,提供方法学参考。方法人工标注文本情感类别,然后进行分词、特征词权重和特征词选择等步骤。用随机森林进行建模,并评估模型性能。结果 1 149条文本纳入分析,正向、负向和中立情感各占34.3%、31.3%和34.4%。共构建18个模型,最优模型准确率0.60。结论影响准确率的原因有样本量、特征词选择、算法选择和参数调整。文本分析也需考虑文本数据来源的准确性才能更好地为卫生政策制定者提供决策的科学依据。

其他文献

陈朝华

【正】近日,陈朝华加盟搜狐担任副总裁兼总编辑,而原总编辑吴晨光任执行总编辑,向陈朝华负责。这是自2014年搜狐总编辑刘春、高级副总裁方钢离职之后,搜狐引入的第二位媒体人

期刊

陈朝南都周刊南方周末副总裁执行总编辑方钢腾讯网副站长上均张朝阳

张建锋

张建锋,阿里云智能总裁、阿里巴巴达摩院院长。他长期奋战在科研一线,将阿里巴巴带入全球一流科技企业行列,先后获得国家技术发明奖二等奖、省科技进步奖一等奖等荣誉。2020

期刊

淘宝网架构师做事风格其在

论小学语文教学中课堂气氛的营造方法

要想提升教学效果需依靠有活力的课堂氛围,从而取得兼容并包的效果。教师在进行教学时,一切要以学生为中心,从而引起学生的学习动机,带动学习自主性,让教师仅仅是课堂教学的

期刊

小学语文课堂气氛

全国首部《3D打印标准化白皮书》发布

近日,我国发布了首部《3D打印标准化白皮书2018》。白皮书由中国电子技术标准化研究院、全国信息技术标准化技术委员会、天威飞马打印耗材有限公司、华南理工大学、广东省3D

期刊

电子技术标准化3D打印白皮书标准化技术委员会质量监督检验中心华南理工大学技术发展现状标准体系建设

银掺杂纳米ZnO光催化性能的提高

分别采用水热法和还原法合成了不同掺杂浓度Ag的系列1和系列2光催化剂Ag/ZnO,其中系列1样品是由大量的球形纳米颗粒形成的团聚物;系列2样品是由大小、形状各异的多面体结构纳

期刊

纳米ZNO光降解水热法还原法nano-ZnOphotodegradationhydrothermal methodreduction method

艾迪注射液在消化系肿瘤替代化疗药物的药理学研究

目的探讨在消化系肿瘤治疗中艾迪注射液是否能完全替代化疗药物及其药理学作用机理。方法将13例消化系恶性肿瘤患者简单随机化随机分为对照组65例（化学药物治疗）、观察组65例（艾

期刊

艾迪注射液肿瘤替代化疗Addie injection Tumor Replacement Chemotherapy

水稻高产栽培技术探究

水稻是与人们的生活息息相关的农作物,我国是世界上最大的水稻生产国和消费国,其中全国有超过60%的人口的主食是稻米。在人口日益增加,土地面积日益减少的背景下,提高水稻产

期刊

水稻栽培现状高产栽培技术探究

铜火法冶炼过程中新型脱杂剂的应用实践

通过对铜火法吹炼、精炼过程中铅、砷、锑、铋等主要杂质的分布状态、脱除机理和物相进行分析研究,开发出一种新型脱杂剂(主要成分为含钠钙的高活性碳酸盐),通过新型脱杂剂在

期刊

火法精炼吹炼脱杂剂阳极铜fire refiningconvertingimpurity removal agentanode copper

王雪红

【正】HTC创始人、董事长王雪红宣布,将出任公司CEO,而原CEO周永明将专注于面向未来的产品和技术研发,担任HTC Future Development Lab的领导者。王雪红出身名门,父亲为中国

期刊

雪红柏克莱大学发货量王永庆硕士学位永明手机市场出身名门高端市场中国台湾

血清降钙素原在重症急性胰腺炎病人菌血症诊断中的应用

目的:探讨重症急性胰腺炎(SAP)病人发生菌血症时,测定血清降钙素原(PCT)的临床意义。方法:选择我院普通外科ICU收治的SAP病人203例,进行外周血培养,并监测血清PCT浓度、C-反

期刊

重症急性胰腺炎菌血症降钙素原C反应蛋白中性粒细胞百分比白细胞

随机森林对文本情感分析的应用与R软件实现

其他学术论文