前言
在我们学习完python基础后
就要选择往哪个方向学习拉
有的同学选择兼职,有的同学选择就业
有的同学想学单个方向,比如:数据分析
那么今天我们来分析一下数据分析岗位薪资与经验/学历占比吧
准备
首先,我们要提前准备好数据
没有数据的同学可以自己先行采集或者找我领取哦~
可加Q君羊:582950881
数据分析流程
原始数据
数据清洗
数据分析
结论
代码展示
导入模块
import pandas as pd # anaconda里面自带的,如果是pycharm需要另外安装# 导入绘图的图表from pyecharts.charts import Bar,Pie # 这个得命令安装
读取csv,并且添加header
df = pd.read_csv('boss.csv') # 默认会隐藏掉一些行pd.set_option('display.max_rows',None) # 设置显示所有行 (一般不做这个操作)df
数据预览
df.head()
数据可视化和简单的分析
不同城市的平均工资差异
mean = df.groupby('address').salary.mean()bar = (Bar().add_xaxis(mean.index.tolist()).add_yaxis("均值", mean.values.astype('int64').tolist()))bar.render_notebook()
各学历薪资均值比较图
mean = df.groupby('diploma').salary.mean()bar = (Bar().add_xaxis(mean.index.tolist()).add_yaxis("平均工资", mean.values.astype('int64').tolist()))bar.render_notebook()
有什么不懂同学可以加Q君羊:582950881
(获取解答/教程/资料/源码)
不同工作经验薪资均值比较图
mean = df.groupby('experience').salary.mean()bar = (Bar().add_xaxis(mean.index.tolist()).add_yaxis("均值", mean.values.astype('int64').tolist()))bar.render_notebook()
市场学历需求占比
data = df['diploma'].value_counts()x = data.index.tolist()y = data.values.tolist()c = (Pie().add("",[list(b) for b in zip(x, y)]))c.render_notebook()
市场工作经验需求占比
data = df['experience'].value_counts()x = data.index.tolist()y = data.values.tolist()c = (Pie().add("",[list(b) for b in zip(x, y)]))c.render_notebook()
行业需求占比
data = df['lables'].value_counts()x = data.index.tolist()y = data.values.tolist()c = (Pie().add("",[list(b) for b in zip(x, y)]))c.render_notebook()
尾语
好啦,本文章到这里就结束拉
有喜欢的小伙伴记得给博主一个三连哦~
希望你在学习的路上不忘初心,坚持不懈,学有所成
把时间和精力,放在自己擅长的方向,去坚持与努力,
如果不知道自己擅长什么,就尽快找到它。