基于TPOT的机器学习自动化教学研究

来源 :看世界·学术上半月 | 被引量 : 0次 | 上传用户:shan527333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:机器学习自动化(Automated Machine Learning, AutoML)指的是为预测模型任务自动选择表现优异的模型。TPOT 是一个开源的数据库,可以使用 Python 语言实现机器学习自动化,可以用于分类任务和回归任务,自动发掘出表现最好的模型。本文将简介TPOT 的作用与用法,为机器学习课程的教学提供参考。
  关键词:自动化;TPOT
  一、基于 TPOT 的自动化机器学习
  TPOT 的全称是 Tree-based Pipeline Optimization Tool,简称 TPOT,与 scikit-learn 的数据预处理和机器学习算法模型结合在一起,是一个自动化机器学习的Python 库[1]。TPOT 使用基于树的结构为预测任务自动寻找最优的表现模型,包括了数据清洗,特征选取,特征预处理,特征构建,模型选择,模型参数调优等,如图 1 所示。
  二、TPOT的使用
  使用 TPOT首先需要建立一个 TPOTRegressor或者 TPOTClassifier 的对象实例,然后将在数据库上表现最好的那个模型输出。配置实例主要包括两个部分:
  1)模型的评价指标,包括交叉验证的方案和衡量的性能指标等。最好通过在配置中明确定义。例如,在回归问题中,可以指定RepeatedKFold 以及‘neg_mean_absolute_error‘;在分类问题中,指定RepeatedStratifiedKFold 和‘accuracy’.
  2)全局随机搜索过程的设置。对于一个进化算法的过程,包括的设置有,种群的大小、迭代的代数、交叉和变异的比率等。前面几个参数对于控制搜索的范围极端重要,后面的几个参数则可以使用默认的参数。
  (三)一个TPOT 用于分类任务的例子
  声呐数据是一个标准的机器学习数据集,有 208 行数据,每行 60 个数值输入变量,以及二值化的输出值,即一个二分类问题[2]。一个简单的模型就可以达53%的准确性。一个表现最好的模型,则可以达到 88%的准确性。这就为这个数据集提供了一个期望的性能表现范围。
  第一步,定义模型的评价指标。我们会用 3 次重复的 10 折交叉验证(repeated stratified k-fold cross-validation)。第二步,在遗传算法中指定种群的大小为 50,然后迭代 5代。需要注意的是,每次的运行结果都可能不同。这是由于遗传算法随机的本质所决定的,又或者是数值精度的不同所决定的。在运行的过程中,表现最好的模型的精度将会在屏幕打印出来。
  在本例子中,我们可以看到表现最好的 pipeline 可以达到 86.6%的精度。pipeline中最好的模型将保存到一个名字叫做”tpot_sonar_best_model.py” 的文件中,如图 2 所示。
  需要注意的是,这些生成的代码并不是可以运行的。这只是一个模板,需要复制到自己的项目中,然后更改相应的地方,如数据来源,存储路径等。从生成的代码中可以看出,表现最好的 pipeline 包含了朴素贝叶斯和 Gradient Boosting模型。学生可以通过 TPOT 生成的代码,对比自己搭建的模型,然后从中学习,提高机器学习建模的水平。
  参考文献:
  [1]周志华,机器学习,清华大学出版社,2016
  作者简介:
  罗晓牧(1980-),男,广东省广州市(籍贯),现职称:副教授,学历:工科博士研究生毕业,研究方向:机器学习,无线传感器网络,生物信息获取。工作單位:广东省广州市番禺区广州大学城广州中医药大学医学信息工程学院。
  基金来源:广州中医药大学教学改革项目 A3-0433-181-427-039
其他文献
摘要:对于高中学生们来说,通过音乐教育学习能够有效促进自身综合素养的提升。同时也为学生们艺术学习打开了大门。让学生们能够对音乐进行欣赏与感悟,有效提高了学生们的音乐素养。而想要提高高职音乐教育的成效,音乐教师要将互动教学法应用在课堂教学过程中。  关键词:高职音乐;互动教学;教学应用  前言:  随着素质教育的发展,高职院校的教师们也要注重对学生们的综合素质进行培养。而为了促进学生们艺术素养的提升
期刊
摘要:众所周知国无德不兴,人无德不立;这句话所表达的含义就是一个国家如果没有德行,那么它便不能兴旺;而一个人如果没有德行便无法立足在这世界上。而中国教育的根本任务就是为了立德树人,小学阶段的道德与法治教学课程正是根据中国教育的根本目标以及小学生的实际身心发展需求开设了一个教育新栏目——绘本故事。在这些绘本故事中不仅体现了日常生活中发生的各种事情,而且内容丰富的绘本故事还能充分激发小学生的无限想象力
期刊
摘要:随着当今时代的不断发展和改革开放的不断发展,人们对教学的重视程度日益提高。我国彝族人主要集中在贵州、云南、四川凉山等地区,他们在日常生活中基本上都用彝语进行交流,大都不用汉语,因此,开展双语教学是非常有必要的。数学是一门比较特殊的科目之一,将这一科目用于双语教育,可以帮助学生进行有效的教学。数学课程不仅在数学教学中发挥作用,而且可以提高彝族语言与汉族语言之间的互换,帮助学生提高自身语言技能,
期刊
摘要:随着互联网的发展,人们接受渠道的信息越来越广泛,内容运营对产品运营有很大的作用,它要求工作人员拥有扎实的文字功底。高中语文教学可以帮助学生培养创作能力,通过不断的练习,培养学生扎实的文字功底。高中语文作文教学分为微写作和大作文,微写作与大作文相比较,微作文更为简洁、精练,对学生的创作能力和写作能力有更高的要求。本文主要讲述了微写作,分析了微写作教学过程中存在的问题,阐述了高中语文微写作教学策
期刊
摘要:《视听语言与分镜》是学习动画专业的学生在构思动画题材和内容时,前期需要准备的工作,是前期创意课程当中最为重要的一个课程,视听语言与分镜头的设计也是绘画艺术同镜头设计关联最密切的地方,因此为了能够让学生理解教学内容和教学知识体系,授课的教师应当对该课程进行多种教学方法的尝试,要找的最适合当代教学目标的教学方式,要充分了解信息化教学模式与传统项目化教学模式各自的优缺点,取长补短的进行教学才能帮助
期刊
摘要:对于小学生而言,数学的学习处于启蒙阶段,数学思想方法的渗透能够有效培养学生的数学思维能力,为后续数学学习奠定良好的基础。教师应结合实际教学经验,思考行之有效的渗透策略,不断提高数学教学质量。  关键词:数学思想方法;小学数学教学;渗透策略  一、数学思想方法的概述  数学思想,是指对数学事实和数学理论知识的本质认识。数学方法,是指用数学来解决问题的方式、方法。所以,数学思想更偏重于对理论知识
期刊
摘要:作文作为初中语文教学的重要组成部分,对培养学生的素质至关重要。然而,传统的语文写作教学方法大多采用模板教学的方法,不能激发学生写作兴趣、调动学生的真情实感,写出来的文章常是空洞乏味。在核心素养理论背景之下,初中语文作文教学方法亟待改进。初中作文教学的重点应该在于引导学生发现生活,让学生从主动观察、体验和感悟生活的过程中找到写作的素材。因此,本文就初中作文教学方法中存在的问题展开分析讨论,找出
期刊
摘要:大学英语四级考试段落翻译是测试考生把汉语所承载的信息用英语表达出来的能力。长期以来,在汉译英教学中,由于学生受限于汉英两种语言文学基础、跨文化知识,加之缺乏有效的解题方法指导,以致很多考生临场解题能力有限。本文作者通过教学实践,提出易于掌握的解题方法和步骤,有效帮助考生提高四级考试翻译解题能力。  关键词:大学英语四级考试;段落翻译;解题方法  一、汉译英考题要求及现状  汉译英是大学英语四
期刊
摘要:随着教育的改革,新课改对初中教学有了较高的要求,数学课堂更加注重学生的情感教育。在初中数学教学中将情感教育渗透于教学的各个方面,可以激发学生学习的积极性,养成热爱生活和学习的习惯,健全学生的品格,进而促进初中学生全面的发展。因此,初中数学教师要重视对学生的情感教育,将情感与教学知识结合起来,尊重学生发展的差异性,从而提高课堂的质量,促进每个学生身心健康和谐发展。本文主要以初中数学教学中渗透情
期刊
摘要:大学生创新创业园作为学校与社会的联系纽带,为高校人才培养和科技成果转化,为大学生了解社会、服务社会提供了良好平台。但目前许多高校创新创业教育仍存在很多不足,为提升大学生的实践能力、创造能力,创新创业实践教学体系改革迫在眉睫,本文以河北工程大学科信学院为例研究高校创新创业实践教学体系改革的举措。  关键词:创新创业;实践教学;改革与研究  国务院办公厅曾在出台的《关于深化高等学校创新创业教育改
期刊