1. 研究目的与意义
随着毕业生人数不断增多,人才招聘水平也随着时代和互联网的发展不断升级。
随着人才信息和岗位信息的数据化,网络招聘平台在人才和用人单位之间起到了重要的桥梁作用。
但是由于人才招聘中存在供需双方招聘矛盾和招聘信息不对称的问题,就会出现毕业生难以找到想要的工作、企业难以招聘到理想人才的情况。
2. 课题关键问题和重难点
1、关键问题应用算法爬虫拉勾网的招聘数据,同时要克服网站的反爬虫技术获取数据,对爬取的数据进行可视化和图像化,并通过招聘系统可视化网站展示,通过机器学习向用户推荐可能需要的岗位信息,并对用户需要了解的岗位薪资进行预测。
2、课题难点①利用数据挖掘技术,爬虫拉勾网招聘数据,克服反爬虫获取网站招聘信息。
②利用图像化技术对招聘数据进行可视化和图像化。
3. 国内外研究现状(文献综述)
数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤。
数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。
数据挖掘中的爬虫和反爬虫技术最具有代表性,本系统应用爬虫和克服反爬虫技术爬取了拉勾网的5000多条招聘数据。
4. 研究方案
1、设计方案该系统使用python开发,结合Layui框架,系统数据库采用mysql;运行平台:windows10及以上,采用Navicat 15 for MySQL作数据库为服务器软件。
2、研制方案和研究方案: 主要包括如下功能模块:(1)后台爬虫模块应用爬虫技术爬取拉勾网招聘信息,克服网站的反爬虫技术获取相应招聘数据,分类并导入excel。
(2)数据图像化模块将excel里的数据按照学历薪资、工作经验薪资、岗位数量情况、全国以及各城市岗位分布情况进行可视化和图像化。
5. 工作计划
1. 第1周:查阅课题相关资料,列出开题报告大纲。
2. 第2周:完成开题报告。
3. 第3周:在熟悉选题的基础上,依据选题的具体功能要求,做好需求分析。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。