中文自动分词相关论文
随着网络技术及Internet技术的发展,计算机技术得到了广泛应用。现代远程教育是网络和Internet应用的一个强有力的例子,它融合了现......
中文自动分词技术是网络搜索引擎的关键技术之一,是中文信息处理中的重要环节,也是智能计算、文献标引、自然语言理解和处理的基础。......
本文在对检索系统关键技术进行研究的基础上,主要实现了一个以统计分词改进算法为基础的网络信息检索系统。该系统通过网页内容提取......
位置服务(Location Based Services,LBS),是指通过移动终端和移动网络的配合,确定移动用户的实际地理位置,从而提供用户所需要的与位置......
中文作为人类传播信息的重要语言工具之一,中文信息处理已经成为信息处理领域的热点研究问题。中文自动分词是中文信息处理的重要......
中文自动分词是中文信息处理的一项重要的基础性任务,是机器翻译、问答系统、自动文摘等技术的基础,也是实现中文搜索引擎所必须的......
近年来,随着计算机的普及与信息化的发展,中文信息处理技术的应用日益广泛,中文自动分词技术是中文信息处理的基础,已应用在文本校......
由于来自于网络的信息具备信息量大、信息来源复杂等特点,人们在查找自己需要的信息时,已经习惯使用搜索引擎作为信息筛选的工具。......
随着计算机应用领域的日益广泛以及信息处理技术水平的不断提高,自然语言信息处理技术一直倍受关注,如何提高计算机对自然语言的理......
中文自动分词是中文自然语言处理的一项基础性工作,也是中文信息处理的一个重要问题,在很多领域扮演着非常重要的角色。中文自动分词......
语音合成技术是信息处理领域的一个重要分支,是人工智能的一个重要研究方向。语音合成的核心技术主要体现在文本分析和合成语音时......
本文借助文本挖掘及其相关技术,针对航海领域,建立了一个基于Web的学术热点发现模型。该模型可对Web上所发表的科技论文进行内容挖......
随着信息检索技术越来越受到人们的重视,其中的中文自动分词技术就显得越来越重要。计算机通过对文本中的词语进行识别与处理,直接......
针对中文自动分词中组合型歧义消解难的问题,提出了一种新的切分算法来对组合型歧义字段进行消歧。该算法首先自动从训练语料中提......
提出一种歧义字段与其所在句子语义联系为依据的中文分词交叉歧义处理方法。该方法模拟人浏览句子按照语义和词语相关度寻找消歧证......
在中文切分算法设计上,好的算法一般要注重两个方面,一个是提高切分精度,另一个是提高切分速度。本文在逆向最大匹配的算法切分基础上......
在分析现有几种中文自动分词算法的优劣且能实现优势互补的基础上,提出一种多种方法融合的中文自动分词算法.利用Visual-Prolog开......
文本信息过滤技术需要解决的一个重要问题是对文档进行形式化处理,使得文本成为可计算和推理的信息,而中文自动分词是中文信息处理的......
首先对各种现有的中文自动分词算法进行简要比较,并指出其存在的问胚,然后针对这些问题,设计了一个基于演化的中文自动分词算法.最......
中文自动分词模块是自动答疑系统的一个重要功能模块。在分析自动答疑系统中问句特点的基础上,提出一种面向课程答疑的中文自动分词......
汉语自动分词是远程教育智能答疑系统的基础,如何根据远程教育智能答疑系统的特点进行相关分词算法的设计是提高答疑系统智能性,促进......
模拟人浏览句子按照语境寻找消歧证据的经验,计算歧义字段与其所在句子的语义相似度和相关度,据此作为语境计算模型,利用歧义字段......
组合型歧义切分是汉语自动分词的难点之一.为此,利用CRF(条件随机场)模型,以歧义字段的上下文的词和词性建立特征模板,进行歧义消解......
设计了一个基于W eb文本挖掘的分词系统。具体介绍了如何将H tm l格式的文档转化为Txt格式文本,以及利用M M法来实现对文档的汉语......
中文自动分词是中文信息处理的基础,交集型歧义字段的消解又是中文自动分词中的重点。本文将CRFs模型用于交集型歧义字段的歧义消......
提出了相对词频的概念,据此建立了语境计算模型,利用歧义字段前后语境信息对组合型分词歧义进行消解。对高频出现的5个组合型分词歧......
中文自动分词技术是中文信息处理领域中一项重要的基础性课题,它对相关领域(如信息抽取、全文检索、数据挖掘、机器翻译、问答系统等......
计算机博弈的研究从上世纪50年代人工智能作为一门学科诞生以来就从未停止过,它在人工智能领域占有举足轻重的地位,并已取得了辉煌......
无论在自然语言处理还是在机器翻译中,中文自动分词都是一个重要的环节。歧义字段切分中的未登录词是中文自动分词中较难处理的部......
互联网给我们带来信息爆炸、快速经济的同时,也带来了很多不利于经济发展和人民生活的不良信息,对WEB信息的过滤成为一个热门的研......
中文自动分词,就是利用计算机将连续文本切分为以词为单位的字符序列。全文检索是以文档的全部信息作为检索对象的一种检索方式,较......
中文分词是机器学习,自然语言处理中的一个基础部分,中文分词处理要对输入的中文语句在字、词、句三个层面上进行处理。在中文中,......
汉语自动分词是中文信息处理领域的基础课题,也是中文信息处理发展的瓶颈之一,其中对中文分词规范的研究,即如何确定一个汉字串是否为......
本文介绍了中文搜索引擎的发展现状,分析了中文搜索引擎中存在的问题,以及与国外先进的搜索引擎的差距,提出了中文搜索引擎的发展方向......
随着Internet及网络技术的发展,计算机技术得到了广泛应用。网上教学平台是Internet和网络应用的一个典型案例,而自动答疑系统是网......
随着我国数字城市的逐步推进,多数城市职能部门迫切需要将非空间数据与空间数据进行叠加和整合。为了将这些非空间信息与空间信息......
设计一种组合型的分词机制:基于字典的双向最大匹配,基于字标注的中文分词方法和隐马尔科夫的分词方式。通过实验的结果比较,表明该种......