【摘 要】
:
论文对国内现有的几种汉语自动分词中的歧义字段切分算法进行讨论,重点分析了BP神经网络的局限,提出了改进,建立了新的BP网络歧义切分模型,使其对于歧义字段的切分精度和效率进一
论文部分内容阅读
论文对国内现有的几种汉语自动分词中的歧义字段切分算法进行讨论,重点分析了BP神经网络的局限,提出了改进,建立了新的BP网络歧义切分模型,使其对于歧义字段的切分精度和效率进一步的提高,为中文分词领域的扩展开阔了新天地。 首先,论文指出中文分词中一个棘手的问题就是歧义字段的切分,并介绍了歧义字段产生的原因以及类别,分析研究常见的三种分词方法针对歧义切分的优缺点,得出最适合高效切分歧义字段的分词算法是基于神经网络的分词法的结论。 其次,论文对神经网络分词法的核心算法BP网络做了详细的阐述,在此基础上建立BP网络的歧义切分模型并对其模型如何进行歧义字段的切分做了详细的解释。然后,对切分模型的优缺点分析,针对其缺点提出改进算法,形成了以BP网络中梯度下降法为核心的,采用分层自适应学习率代替固定的学习率,在一定条件下融合模拟退火算法的新算法。在新算法的基础上建立新的歧义切分模型。 最后,论文进行新旧模型的对比实验。实验数据表明,改进后的新模型不仅克服了传统歧义切分模型的缺点,而且在切分准确率上和切分时间效率上都有明显的提升。同时,对全文工作做了总结,并提出了进一步的研究方向。
其他文献
最优化问题融合了人工智能、计算机科学和数学等学科,在工业工程、经济和管理等领域有广泛的应用。线性和非线性优化问题是优化问题的两种基本形式。非线性优化问题很难在用
随着计算机技术的飞速发展,图像处理和计算能力得到了极大提高,计算机视觉也取得了较快的发展。视觉目标跟踪技术是计算机视觉领域的重点问题。目前虽然专家学者已经研究了很
近年来,3D人脸识别一直是当下模式识别领域的热点。3D人脸识别相对于指纹识别,虹膜识别等识别系统有着先天的优势,主要体现在操作简单方便,对目标具有相当小的侵犯性,甚至可
随着网络技术的发展及应用的普及,园区网结构和用户行为越来越复杂,管理也变得愈加困难。作为网络行为的主体,主机的使用者是网络行为的责任人,因此对网络用户的网络行为管理
科学技术的突飞猛进、世界范围的互联网络,使得人们获得的数据量急速增长,与人们生活密切相关的电信业也积累了海量的数据。数据挖掘技术的出现使得电信运营商得到启发,他们在行
随着人们生活质量的不断提高和传感器网络技术的进步,具有网络传输功能的智能物件不断融入人们的生活,成为生活必需品。智能物件大多采用无源供电,因此,智能物件数量的增加给
手语是聋哑人群体用来交流、学习的主要手段。许多国家和地区都将手语作为一门语言学来研究,并且取得了一定的成果。在计算机领域,研究者们根据手语语言学者的研究成果,将手
随着网络技术的飞速发展,用XML表示与存储的数据量与日俱增,尤其在网络数据的发布,各组织间的数据交换以及电子商务等应用领域中。XML已经成为数据表示,存储与交换的标准,在X
测控系统要想获得原始数据需要通过传感器,压力传感器由半导体材料的压阻效应做成的传感器,是一种以压力作为被测量转化成电流或电压的器件。由于压力传感器的非线性特性及热
面向领域的数据库问答系统是允许用户用自然语言访问数据库的一种方式,它是多学科交叉的产物,涉及自然语言处理,数据库技术,人工智能,人机界面等多方面研究。四十多年来,面向