#拉勾网职位数据分析
-
利用爬虫获取拉勾网招聘数据,了解互联网行业最新职位动向
-
借助Excel2013进行统计分析与可视化
-
对每个职位的详情数据进行二次抓取,进行分词、统计,获取标签云,生成对于每类职位的__职位印象__
###使用方法
-
从github地址clone下该project
-
更改 job.xml 的路径
-
运行 lagouspider.py 获取拉勾网json数据
-
运行 excelhelper.py 生成每份职业对应的Excel
-
运行 jobdetailspider.py ,对招聘信息详情进行二次爬取 ----V1.3 updated
-
运行 analyser.py 分词,获取排名前20的热度词 ----V1.3 updated