n-gram模型相关论文
中医医案是中医医生学习临床经验的重要文献资料,对中医医案进行结构化处理有利于采用机器学习等方法总结临床经验,加速中医传承。为......
随着互联网在社会进程中的快速发展,人们的生活越来越离不开网络,在使用网络的过程中,用户的身份及行为信息也都会被保存在网络上,......
随着计算机和互联网技术的发展,网络安全问题日益突出,入侵检测系统是维护网络安全的重要手段。目前,入侵检测系统中所开发的模型......
统计语言模型是上世纪80年代兴起的语言建模方法。经过20多年的发展,它已经渗透到了计算语言学的各个层面,并且在以下各个领域都取得......
随着Internet的快速发展,Web已成为全球性的、巨大的、分布和共享的信息空间,它为人们搜索信息提供了一种新的手段。但随着Interne......
随着互联网技术的飞速发展,网络安全越来越受到人们重视。恶意病毒检测是信息安全领域一个重要课题,其中对HTTP攻击检测是新的研究热......
在大规模的文件存储系统中,元数据访问性能的优化对文件系统的整体性能提高有着非常重要的影响。为了使元数据服务的性能达到最优,......
在已经到来的Web 2.0时代,搜索引擎在互联网上扮演了越来越重要的角色,而日益增多并且成熟的互联网用户对搜索引擎的要求也越来越......
随着互联网和信息处理技术的飞速发展,电子书、电子报纸、电子邮件等电子文本已成为人们日常生活的一部分,同时文本错误也越来越多......
航天技术的飞速发展累积了大量的航天情报信息,这对情报管理工作提出了更高的要求,传统的人工管理方式已经不能满足需求,为了更加......
文本校对是蒙古文自然语言处理的基础工作之一,文本校对工作的推进将直接影响到蒙古文信息处理工作的有序开展。为了解决传统蒙古......
在软件开发过程中,开发人员会收到并处理用户提交的大量缺陷报告。为了提高开发人员处理缺陷报告效率,对于一份查询缺陷报告,本文......
医学影像分类技术是计算机辅助诊断中的关键技术,但是“语义鸿沟”、数据不均衡、维数灾难等问题阻碍了分类模型在临床中的推广。......
本文采用自然语言处理技术,通过分析中文文本一般错误类型,并结合新闻领域文本的特征,确定研究范围为基于同音词替换产生的短距离......
针对基础词更能表达中文文本所包含的基本信息,更适合于后续的文本挖掘,提出一种基于N-gram的双向匹配中文分词方法.充分挖掘训练......
本文针对多媒体文档的融合和提取进行研究和试验,提出了一种多媒体文档融合方案对教学场景中的视频、声音、教案数据和操作序列等......
近年来,智能人机交互在人们的日常生活中占据了越来越重要的地位。随着人机交互的不断发展,要求人们使用更加直观快捷的交流方式。......
摘要:哈萨克语是组成结构复杂的黏着性语言,哈萨克语词干提取词缀提取对哈萨克语信息处理领域具有很重要的意义。从哈萨克语粘着性特......
本文运用语料库语言学统计与规则相结合的方法对中文文本自动查错的有关问题进行探讨,运用词二元与三元接续关系进行查错,主要依据......

