基于膨胀卷积神经网络模型的中文分词方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:pc167
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,许多深度神经网络模型以双向长短时记忆网络结构处理中文分词任务,存在输入特征不够丰富、语义理解不全、计算速度慢的问题。针对以上问题,该文提出一种基于膨胀卷积神经网络模型的中文分词方法。通过加入汉字字根信息并用卷积神经网络提取特征来丰富输入特征;使用膨胀卷积神经网络模型并加入残差结构进行训练,能够更好理解语义信息并提高计算速度。基于Bakeoff 2005语料库的4个数据集设计实验,与双向长短时记忆网络模型的中文分词方法做对比,实验表明该文提出的模型取得了更好的分词效果,并具有更快的计算速度。
其他文献
茶,是古老的传统产品,随着时代的变迁茶也在不断变化,不断推陈出新。从汉唐的茶砖粗糙烹煮,到明清的炒茶焙制,到今天的以食品安全、健康调理为理念地做茶,与时俱进的开拓精神
黑龙江省是湿地资源大省,是中国内陆湿地面积较大、分布广泛的省份之一。具有湿地面积大、类型多样,沼泽及沼泽化草甸湿地占优势,湿地分布集中、地域性明显,生物多样性丰富等
目的:本研究的目的是研究颅内静脉窦血栓的临床特点,并着重探讨脑静脉窦血栓形成的患者癫痫发作危险因素,回顾性分析脑静脉窦血栓形成伴或不伴癫痫发作的患者的年龄、性别、病因、临床表现及影像学资料。从而提高对静脉窦血栓形成患者的认识,更全面的认识CVST患者癫痫发作的特点,做到更好的诊治和预防,减少癫痫发作对CVST患者带来的痛苦。方法:回顾性分析2012年1月至2019年2月就诊于南昌大学第一附属医院的
随着我国矿产资源的开发利用,诸多问题随之而来。特别是矿产企业在变相转让矿业权的过程中,存在的问题尤为突出,通常是以转让股权的形式,达到变相转让矿业权的目的。本文重点从审
<正> 2003年6月28日,由卫生部疾控司和高血压联盟(中国)共同主办,辉瑞、诺华、默沙东和赛诺菲圣德拉堡民生4家制药企业大力支持的《中国高血压防治指南》专家讨论会在京举行
随着社会的不断发展和进步,人们的出行需求越来越高,与之相配套的路况设施发展迅猛,而在重视公路规划和里程的同时,减少不必要的迂回盘旋和缩短路线也正变得越来越重要,桥梁
贾谊《服鸟赋》的思想内涵:其一,“齐万物”,以泯除物之分别,“齐物论”,以泯除祸福、吉凶、荣辱、生死之分别;因为齐,故没有拣择、好恶、贪嗔,而能顺应事物的变化。其二,事物
论述了国内外对富含二氧化碳的天然气分离技术的研究进展,包括:膜分离法、变压吸附(PSA)法、物理吸收法和化学吸收法等,并分析了天然气资源的深加工利用及其产品开发前景。
目的对西药房不合理用药处方进行分析,提出相应的处理措施,以提升临床处方用药的规范性和合理性。方法将2017年10月~2018年3月作为研究时间段,在该时间段从门诊西药房每月选取