【摘 要】
:
随着Web2.0的不断发展和流行,互联网上的信息量急剧增加,用户很容易迷失在信息的海洋中。网络招聘信息,作为互联网信息的一种,广泛充斥在互联网中。而且,就业信息网站林林总总、真
论文部分内容阅读
随着Web2.0的不断发展和流行,互联网上的信息量急剧增加,用户很容易迷失在信息的海洋中。网络招聘信息,作为互联网信息的一种,广泛充斥在互联网中。而且,就业信息网站林林总总、真假难辨。面对海量信息,信息检索和信息过滤是当前两种主要的解决方案。其中,信息检索的结果是大众化的,只要输入的关键词一样,搜索结果就相同,并且搜索结果的数据量可能仍然很大。而信息过滤则能有效的弥补信息检索的不足,通过个性化定制的方法进一步提升用户体验度。常用的信息过滤方式为个性化推荐。因此,本文在就业信息的处理中充分结合信息检索和信息过滤这两种方式,为求职者尽可能简洁高效的提供真实有用的信息。此外,本文结合一些Web开发的相关技术,利用Mysql、SolrCloud等开源软件设计并实现了第四方就业信息推荐系统。论文主要工作包括:①实现就业信息的抓取、解析和清洗。本文首先采用网络爬虫的方式从各大第三方招聘网站抓取信息。然后对获取的就业信息进行清洗和格式整理。最后,将所有格式化的就业信息映射到一个标准的行业分类目录上,形成一个分类一致的就业信息数据集。②实现就业信息的分布式存储。本文采用Mysql数据库集群的数据存储方案,通过负载均衡、数据切分、读写分离等方法,保证数据库并发读写效率和分布式数据库事务的正确性。③搭建分布式全文检索系统。本文采用SolrCloud作为分布式全文检索引擎,Zookeeper作为搜索引擎集群监视器和配置文件管理器,搭建了一个高性能、高可用的分布式全文检索系统。④实现就业信息的个性化推荐。利用用户的行为数据,基于用户的个性化推荐算法为用户推荐感兴趣的工作;利用评分可信度和Hadoop框架,研究和设计了基于评分可信度的UserCF并行推荐算法。
其他文献
商标权作为企业无形资产的重要组成部分,可以为企业带来无法想象的巨大利润和顾客的忠诚度,一个企业的持续发展能力不仅仅停留在商品的利润上,更重要的是在消费群体中树立的形象
沈德潜一生于唐诗用力甚多,唐诗在其诗学理论中占有重要地位。沈德潜重视诗歌史的梳理,也特别注重各时代诗歌所具有的"诗教"之用。唐诗是他对诗歌史进行溯源辨流的起点,也是
2013年底,住建部、财政部、国家发改委公布《关于公共租赁住房和廉租住房并轨运行的通知》,要求全国从2014年起,各地实施“两房并轨”。本论文开始于这项保障房的最新政策提出之
通过对不同强度等级下的混凝土小梁试件进行各龄期的弯拉强度和弯拉弹性模量的试验研究,加强对路面混凝土力学性能及其发展规律的认识,可为混凝土路面设计与施工的路面质量评
民以食为天,食品问题关乎每个人的日常生活,关乎国家的长治久安,也关乎人类的生存和发展,它关系百姓的生命健康和社会的稳定发展。随着经济的发展、科学技术在食品方面的大范围、
<正>中国东、南面是大海,西面是沙漠、高山,北面是戈壁、森林,处在一个相对封闭的地理环境当中,不利于与外界的沟通。但是,中国自古以来并没有自我封闭,经过陆路和海上丝绸之
为了加强对广州市各综合性能检测站的管理,根据《广东省汽车综合性能检测站技术规范文件》的相关规定,管理部门提出对联网系统进行进一步完善或升级的有关要求,这对达到数据
传统对称半桥电路结构和控制简单且具有自动抑制变压器磁偏的优点,在焊机中应用广泛。但是传统对称半桥电路工作于硬开关状态,且两个开关管同时关断时其变压器漏感与开关管寄生
本研究以重庆市新生代农民工为研究对象,探讨了新生代农民工的职业流动意向及其影响因素,以期对新生代农民工的职业选择和自身发展提供一定的借鉴,对企业和政府部门的人力资源管
采用反相悬浮法,通过环氧氯丙烷交联制备β-环糊精改性交联壳聚糖微球(CDS),用FTIR和SEM进行表征,研究其对甲基橙(MO)的吸附和缓释性能。考察吸附时间、溶液p H值、MO浓度、