随机森林对文本情感分析的应用与R软件实现

来源 :现代预防医学 | 被引量 : 0次 | 上传用户:songyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的文本数据与日俱增,但较少应用于公共卫生领域。本文旨在阐述如何通过随机森林和R软件实现文本情感分析,提供方法学参考。方法人工标注文本情感类别,然后进行分词、特征词权重和特征词选择等步骤。用随机森林进行建模,并评估模型性能。结果 1 149条文本纳入分析,正向、负向和中立情感各占34.3%、31.3%和34.4%。共构建18个模型,最优模型准确率0.60。结论影响准确率的原因有样本量、特征词选择、算法选择和参数调整。文本分析也需考虑文本数据来源的准确性才能更好地为卫生政策制定者提供决策的科学依据。
其他文献
【正】近日,陈朝华加盟搜狐担任副总裁兼总编辑,而原总编辑吴晨光任执行总编辑,向陈朝华负责。这是自2014年搜狐总编辑刘春、高级副总裁方钢离职之后,搜狐引入的第二位媒体人
张建锋,阿里云智能总裁、阿里巴巴达摩院院长。他长期奋战在科研一线,将阿里巴巴带入全球一流科技企业行列,先后获得国家技术发明奖二等奖、省科技进步奖一等奖等荣誉。2020
要想提升教学效果需依靠有活力的课堂氛围,从而取得兼容并包的效果。教师在进行教学时,一切要以学生为中心,从而引起学生的学习动机,带动学习自主性,让教师仅仅是课堂教学的
近日,我国发布了首部《3D打印标准化白皮书2018》。白皮书由中国电子技术标准化研究院、全国信息技术标准化技术委员会、天威飞马打印耗材有限公司、华南理工大学、广东省3D
分别采用水热法和还原法合成了不同掺杂浓度Ag的系列1和系列2光催化剂Ag/ZnO,其中系列1样品是由大量的球形纳米颗粒形成的团聚物;系列2样品是由大小、形状各异的多面体结构纳
目的探讨在消化系肿瘤治疗中艾迪注射液是否能完全替代化疗药物及其药理学作用机理。方法将13例消化系恶性肿瘤患者简单随机化随机分为对照组65例(化学药物治疗)、观察组65例(艾
水稻是与人们的生活息息相关的农作物,我国是世界上最大的水稻生产国和消费国,其中全国有超过60%的人口的主食是稻米。在人口日益增加,土地面积日益减少的背景下,提高水稻产
通过对铜火法吹炼、精炼过程中铅、砷、锑、铋等主要杂质的分布状态、脱除机理和物相进行分析研究,开发出一种新型脱杂剂(主要成分为含钠钙的高活性碳酸盐),通过新型脱杂剂在
【正】HTC创始人、董事长王雪红宣布,将出任公司CEO,而原CEO周永明将专注于面向未来的产品和技术研发,担任HTC Future Development Lab的领导者。王雪红出身名门,父亲为中国
目的:探讨重症急性胰腺炎(SAP)病人发生菌血症时,测定血清降钙素原(PCT)的临床意义。方法:选择我院普通外科ICU收治的SAP病人203例,进行外周血培养,并监测血清PCT浓度、C-反