主动学习文本分类方法及其应用研究

来源 :福州大学 | 被引量 : 1次 | 上传用户:hyron2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大。机器学习算法作为实现人工智能的重要工具,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。在计算机还不能够胜任一些通常需要人类智能才能完成的复杂工作时,主动学习算法成为进阶至这一阶段的必经之路。主动学习算法使得机器学会在执行任务的过程中何时向人类发问,在获得人类的指示后,将其转化为自身经验,应用到日后执行任务的过程中去。这是机器走向人工智能的一个非常重要的环节。对自然语言的处理和文本内容的挖掘是机器学习在人工智能方面应用的重要领域。将自然语言数字化并通过运算得到新信息的过程,是否能代替人类阅读思考的过程,是长久以来学者们研究的课题。本文首先从主动学习的概念入手,对主动学习算法的基本思路和发展规律的相关理论进行了论述。按照逻辑关系总结了迄今为止较为经典的主动学习算法,并介绍了这些算法的应用现状,从而形成了一个关于主动学习算法的整体认识。继而本文探讨了训练集不完整的问题对主动学习算法的影响,并提出了可以克服这一问题的主动学习算法框架。本文提出了可用分布式计算实现的IGAKME文本聚类算法作为主动学习的选择算法。在此基础上,提出了以支持向量机(Support Vector Machine,SVM)作为基准学习器的主动学习文本分类算法SVMAL-IGAKME,并设计仿真实验,探究该算法是否可·以在训练样本不完整的情况下,训练出性能足以匹敌训练样本完整时普通SVM所训练出来的模型。SVMAL-IGAKME算法可以应用于一些更新速度较快的短文本的分类问题,具有很强的现实意义。
其他文献
与利用微处理器(CPU或Mcu)来实现乐曲演奏相比,以纯硬件完成乐曲演奏电路的逻辑要复杂得多,如果不借助于功能强大的EDA工具和硬件描述语言,仅凭传统的数字逻辑技术,即使最简单的演
期刊
期刊
依据学校中学生家长所来源的占主导的社会阶层,学校可以被相应地分为中产阶级子弟学校、市民学校和贫民学校。从家长对学校的态度、教师对家长的看法两个角度发现,中产阶级子
书法和装饰是两种艺术形式,但二者的联系又非常密切。书法作为装饰图形自古至今被广泛的应用到各种艺术设计作品中,涵盖了与我们生活相关的衣、食、住、行等方方面面,拓宽了
翻译教学长期以来以“教师为中心”的模式所统治,学生在传统教学模式下总是被动接受,其主体性地位往往被忽视。传统翻译教学模式培养出来的学生并不能很好地适应市场需求,过多地
一、我国造纸工业对水环境影响的现状 造纸工业三废排放导致的环境污染,其中以水污染最为突出,造纸废水污染防治早已成为我国工业污染防治的焦点、热点和难点问题.造纸工业废
有无明确的教育方向和特点,是一个专业能否存在和发展的基本前提。国家教委委托机械部组织领导的机械设计及制造专业教学指导委员会(以下简称教学指导委员会)在1993 年第七次
长期以来,我国商业银行网点的前台功能庞杂.大量事务性工作占据了网点员工的绝大部分时间和精力。现代商业银行建立高度集约化后台管理体制的目的是使网点从繁杂纷乱的工作中解
1981 ̄1982年冬季在湖南省常德、汉寿、益阳和沅江市(县)进行了雁形目鸟类的寄生蠕虫调查。共剖检鸭科鸟类5属15种122只,检出蠕虫34种,隶属4钢4目12科23属,其中吸虫7科9属18种,绦虫1科10属12种,线虫3科3属3种,棘头虫1科1属1种