基于TF-IDF的卷积神经网络新闻文本分类优化

来源 :西南科技大学学报 | 被引量 : 0次 | 上传用户:ynshisss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对使用词语级别的预训练嵌入向量初始化卷积神经网络的嵌入层在计算资源有限时存在内存溢出和训练时间长的问题,对新闻文本作出假设:去除部分不重要的词语不会影响最终分类效果,并基于TF-IDF提出一种类别关键词提取方法。通过提取类别的关键词减少词表,进一步减小嵌入矩阵的大小。在THUCNews数据集上进行的实验表明:当嵌入矩阵参数减少近89%时,在CPU的训练时间减少约49%,模型大小减少约87%,分类性能不受影响。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
南江坪河石墨矿是四川省典型的含钒晶质石墨矿,在对坪河石墨矿变质岩岩相学和岩石地球化学特征研究的基础上,分析了变质岩的原岩类型及其古沉积环境。变质岩样品的ωSiO 2/ω
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
近年来,河北省各级财政部门积极适应政府投资爆发式增长的新形势,充分利用投资评审工具努力对政府投资实行全覆盖、全过程、全方位评审,使政府投资可管可控,有效降低了政府投
就某中板厂四重式热矫直机在生产中暴露出的润滑不良问题,有针对性的将其矫直辊、尤其是支承辊轴承座的润滑改造为油气润滑,取得了不错的效果。
氢键组装侧链超分子液晶聚合物具有设计灵活、合成简单、组装方便及动态响应等特点。文中按组装氢键的种类对这类侧链超分子液晶聚合物的最新研究进展进行了总结与评述,并展望
蕾钢发电厂10kV母线为降低分布电容电流对系统发生接地故障时造成危害,而采用了消弧线圈补偿分布电容电流。因旧式消弧线圈技术落后,满足不了安全运行需要,于2003年引进了XHJZ智
从信访制度的设计、大庆信访的现状、相关建议三个方面进行论述,深刻分析了大庆信访的基本情况、矛盾症结及原因,提出了相关建议。
随着网络技术的发展和教育理念的变革,合作学习被认为极有发展和应用前景的网络教学策略之一,而基于网络的合作学习的教学设计及教学模式是亟待深入研究的问题。本文阐述基于网