分词算法相关论文
在线教学在计算机技术的迅速发展和教学的不断改革下日益普及。各大高校纷纷构建自己的在线教学平台,给予学生更加自由的学习机会......
学位
中文分词技术是中文信息处理中的重要环节,中文分词算法与中文分词系统的性能紧密相关。目前的分词算法可以分为基于字符串匹配的分......
本文对开放式文档同构引擎进行深入研究,旨在实现一个用于底层支撑作用的文档引擎,使高层内容安全产品摆脱文档异构化和文档理解的......
随着网络技术及Internet技术的发展,计算机技术得到了广泛应用。现代远程教育是网络和Internet应用的一个强有力的例子,它融合了现......
随着网络的迅速发展,在浩如大海的网络信息中,找到需要的信息,越来越费时费力。如何快速有效地找到有用信息成为当务之急,搜索引擎孕育......
文本分词和特征表示是文本处理领域的两个重要问题。本文在这两个问题上提出了新的见解,并且在文本分类的应用环境中对提出的方法进......
我们已经进入一个信息革命的新时代,这个信息时代的显著特点是计算机在人类生活的各个方面,起着越来越大的作用。自然语言是人们最重......
如今,伴随着网络的快速发展和壮大,各式各样的信息也随之而来,其数量是难以估计的,其中又是以文本形式存在的数量最为巨大。对于这些数......
音字转换技术是建立在语言学、计算机科学、数学、信息论、人工智能等多个学科基础之上的一项综合研究,一直以来就是中文信息处理......
彩铃业务是个性化多彩回铃音业务(CRBT,Coloring Ring Back Tone)的简称,是一项由被叫用户定制,为主叫用户提供一段悦耳的音乐或一......
本文设计并实现了一个灵活、可配置、具有良好可扩展性且效率较高的校园网FTP搜索引擎系统。 本文在研究Web搜索引擎的基本原理......
随着信息技术的高速发展,中文信息处理在计算机各个领域得到了长足的发展,而中文分词是中文信息处理的基础所在,由于词是连接句子......
外包数据库模式下,文档数据存放在不可信远程数据库服务器端,由于文档数据的敏感性,需要对明文文档数据加密,但加密后的数据失去了......
词是最小的能独立表示语义的语言单位,因而是处理各种自然语言文本的基础。汉语书写显得很特别,因为它没有明确的标志将词与词分开......
搜索引擎是信息检索必备的工具,也是一门非常适用的技术,虽然各大搜索引擎在不断地完善和发展自己的技术,但是仍然满足不了用户的......
电子商务的迅速发展使得越来越多的用户喜欢在网上购买商品,用户在购买商品时通常喜欢参考别的用户对该商品的评论,来判断该商品是否......
近年来微博凭借其集成化、开放化、操作简单、传播迅速以及覆盖面广等特点在世界范围内得到流行,然而随之而来的微博隐私泄露方面问......
新款锤子手机支持一项名为“Big Bang”的新功能,可以将用户手机密密麻麻的文字信息一下子炸开到这个屏幕里面,便于选择其中的内容。......
本文分析了文本自动分类的关键理论及技术,给出一个基于向量空间模型的文本自动分类系统的框架模型,重点描述此系统的实现算法。......
在计算机问世的初期,人们就梦想着计算机能够理解人的语言,并一直为之努力奋斗;到了20世纪,随着计算机的功能、容量和速度的巨大提高,自......
随着信息技术的高速发展,Internet上的Web页面数量呈指数增长。有效地组织和处理这些海量信息,为人们创建一个绿色的网络交流环境......
汉语自动分词是中文自然语言处理的一项基础性工作,也是中文信息处理领域的一项基础性课题。本文从理论上分析和比较了目前各种汉......
在我国加入WTO组织以后,经济实力得到快速的发展,物流这个新兴的行业也得到了长足的发展。由于我国物流行业处于快速增长期,各方面......
随着社会的快速发展,人们生活水平不断提高,对于医疗健康问题更加重视起来,如今有很多问答系统,人们可以通过此技术直接获取需要的......
垂直搜索引擎是用户利用网络资源不可或缺的工具,而其中的索引引擎和查询引擎都使用到了分词算法。前者依据分词算法分析文本建立......
对中文分词进行研究是自然语言处理的重要步骤,结合字典对短中文进行正逆向分词,在此基础上得到多组分词结果,利用基于统计的方法......
为了更好地利用中文搜索引擎系统,需要了解搜索引擎的一些关键性技术。笔者选择了国内知名度最高的搜索引擎系统百度作为研究对象。......
纵观信息爆炸时代的特征,信息量虽然急剧增大,但信息类型还是有限的。笔者提出,在分词之前先由用户通过选择特定领域词库来确定核心词......
智能搜索涉及多种技术,其中,中文语言处理技术是其中重要的一种,它可以帮助提高查询中文的准确度,并丰富搜索引擎的特色功能。......
介绍了Lucene检索技术中文本解析器的实现和建立索引时的一个关键算法最大匹配分词算法,对此算法进行了改进并把它应用到对信息丈档......
本文介绍了搜索引擎的关键技术——中文分词技术,对中文分词技术的概念、常用算法以及分词的难点进行了详细介绍,让读者对中文分词......
对词库进行改造的基础上,提出了一种改进的匹配算法,突破了最大匹配分词算法分词的长度限制,提高了中文分词的速度和效率.......
从学习和规范聋人手语的角度出发,实现集翻译、教学和训练评价于一体的中国手语多媒体数据库。该系统建立了适合中国健听人和聋哑儿......
列控中心作为一种安全相关系统,要求具有极高的安全性和可靠性,满足铁路信号系统的故障-安全原则。测试是列控中心软件投入使用前......
针对当前研究的热点问题——界面层自然语言理解的应用,设计和研制了一个面向对象的受限汉语自然语言数据库查询系统DMNLQ。该系统......
文本挖掘是数据挖掘的重要内容之一,其应用十分广泛。对文本文件进行分析的一个前提条件是对文本文件进行分词处理,中文分词是进行......
新词的识别和歧义的消解是影响信息检索系统准确度的重要因素.提出了一种基于统计模型的、面向信息检索的自适应中文分词算法.基于此......
文章针对基于中文机构名简称的检索方法,研究了机构名的结构特征,提出了中文机构名简称和全称匹配的一种新算法的应用,通过计算中文机......
随着移动通信技术的飞速发展和手机普及率的迅速提高,手机短信越来越受到众多人士的青睐。短信业务之所以成为人们的一种重要通信......
针对人工智能在信息过滤领域的实际应用,提出了一种基于分词算法的过滤技术。该技术突破以往企业信息过滤技术的传统模式,将分词算法......
基于Web文本挖掘问题,提出了一种改进的索引结构的词库组织体系及基于该词典结构的中文分词算法。同时,加强消除歧义方面的处理,分词......
提出一种基于最大匹配分词算法的中文词语粗分模型,通过对最大匹配分词算法做出改进,解决了最大匹配分词算法所不能解决的一些问题......
在Lucene的全文检索工具包的基础上,分析现有的主流中文分词算法和Lucene相关度排序算法,提出了改进的分词算法和改进的相关度排序算......
文本口令是现今网络信息系统用户身份认证的关键凭据。为评估用户口令的安全性,运用分词算法将获取的口令样本中的每条口令拆分成......
内容过滤是网络安全领域的一个新课题,目前对内容过滤技术的研究集中于对关键词的检查和分析,过滤精度较低.该文建立了一个基于向......