爬虫-拉勾职位数据分析

释放双眼,带上耳机,听听看~!

年后犹豫找工作到底应该去哪里,且想到之前盲目找工作遇到的各种坑爹问题,网上搜寻相关的信息进行抉择,结果无功而返,于是决定稍微花点时间对拉勾做一次数据分析。

爬取时间:2018/2/6
技术:Java

拉勾的数据爬取相对容易,主要针对了部分职位的数据获取,数据主要包含近一个月内的职位发布,为防止反爬,设定为单线程延迟1s,所以不到半小时获取3w数据进行分析,应该具有一定的参考意义。

爬虫-拉勾职位数据分析

编程语言岗位发布数量统计

爬虫-拉勾职位数据分析

前端仍然非常火热,目前明显是高于其他岗位的,且按照发展时间推算的话,找工作比移动端要容易些,不排除未来的人口大爆发。移动端经历寒冬,趋于稳定,Java长期发展已经非常稳定了,C#似乎有点………..

总体岗位地区分布图

爬虫-拉勾职位数据分析

IT行业,北京一览众山小….

Java岗位地区分布图

爬虫-拉勾职位数据分析

结合上图总体岗位分布,可以看出杭州Java的迅速发展,超越深圳,次于上海,阿里巴巴应该起到不小的带领作用!

Android岗位地区分布图

爬虫-拉勾职位数据分析

针对Android 岗位,北京仍然是遥遥领先其他城市,基本是其他大城市加起来的总和…..

公司岗位发布数量排名Top20:

公司 岗位数量 坐标
美团点评 309 北京
滴滴出行 305 北京
腾讯 279 深圳
百度 259 北京
武汉佰钧成技术有限公司 212 深圳
小米 211 北京
今日头条 200 北京
好未来 149 北京
爱奇艺 129 上海
美图公司 119 深圳
泛微 113 广州
搜狗 112 北京
京东商城 111 北京
江苏亿科达 102 上海
蚂蚁金服集团 98 杭州
瓜子二手车直卖网 95 北京
网易 89 杭州
Face++ 81 北京
微创 75 廊坊
作业帮 70 北京

从结果看出:在招职位比较多的都是些大公司,且坐标多为北京,如果能够分散一些就好了,难道这是导致北京拥挤的原因吗?

薪资区间高频排行

绘图太耗时了,不如表格方便快速,由于爬取过程中忽略了年限要求的爬取,所以这次薪资统计的合并统计可能不太公正,所以我用该地区出现频率最高的薪资作为该地区参考标准,仅供参考!

坐标 薪资 出现频率
深圳 15k-30k 388
广州 15k-25k 307
北京 20k-40k 261
上海 10k-15k 221
杭州 8k-16k 94
宁波 6k-12k 88
肇庆 5k-10k 86
合肥 6k-10k 66
南宁 8k-10k 54
南京 10k-18k 53
贵阳 6k-8k 35
沈阳 4k-6k 33
苏州 7k-10k 25
天津 3k-5k 25
重庆 7k-12k 25
青岛 9k-15k 19
惠州 5k-7k 14
郑州 5k-9k 13
西安 7k-9k 8
厦门 15k-26k 4

【转自慕课】https://www.imooc.com

Python

我的第一个Scrapy 程序 - 爬取当当网信息

2022-3-3 18:50:44

Python

慕课网学习每月总结——2018.1

2022-3-3 18:51:10

搜索