论文部分内容阅读
为了提高大学毕业生就业市场的效率,充分发挥招聘网络平台每日数以万计招聘信息的价值,以解决大学生结构性失业问题,本文运用关联分析、聚类模型和文本挖掘技术等大数据处理和分析方法对网络招聘信息数据进行建模分析,了解、掌握招聘企业的招聘要求,为求职者提供与招聘相关的重要因素,以获取相关岗位的价值信息,力图为求职者提供就业指导、为人才培养机构制定培养方案提供参考。文章以国内大型网络招聘网站的招聘数据为样本数据,以数据相关类职位信息为研究对象,完成原始数据去重去空、属性匹配、数值转换等数据预处理工作之后,对招聘企业的地理区位、学历要求、工作经验、薪资待遇、所属行业、业务类型等进行探索性分析与可视化展现。着重分析了此类岗位的平均薪资与区位、学历、工作经验、业务类型之间的相关关系,并首次尝试ggplot可视化风格呈现探索结果。运用关联规则分析和聚类分析,得到与招聘企业招聘要求相关的关联规则,并根据不同的地理区位、不同的业务类型将招聘企业划分为3类,同时结合文本分析针对性地分析了 3类企业的招聘特点与岗位职责要求,进行了企业画像。从分析结果可知,数据相关类的职位主要集中在移动互联网行业,以技术型和产品型业务需求最大,并且北京、上海、广州、深圳四个一线城市覆盖了全国超过80%的职位。通常要求大学本科学历与2到3年的工作经验,且经验优于学历,其平均薪资集中在1.5-2.5万元之间。同时,针对挖掘结果分别对数据相关类职位的求职者提出了围绕“北上广深一线城市”、“本科学历”、“工作经验”、“高薪资”、“技术型”、“后端开发”、“数据库”、“数据分析”等关键词的相关建议;对高校提出了加重核心专业课程、注重应用型人才培养、引入相关设备等建议。文章的整套挖掘流程同样可以运用到其他职位,挖掘分析不同职位的招聘需求与相关因素。