Excel课程设计
提供一组数据,需要对数据进行读入、整理、分析并绘制图像呈现结果。使用的功能与前述内容相似,即数据的处理、数据分析和数据呈现。
通过对数据的分析,主要是回答以下几个问题
- 数据分析师主要是哪些规模的公司在招聘?
- 这些公司主要分布在北京哪里?
- 薪酬水平与企业规模有没有关系?
希望大家对于数据分析师的招聘有一个简单的认识。
此次课程设计的数据源自于作者7月份对智联招聘上北京市数据分析师招聘数据的爬取,相应的招聘链接可能已经失效,但仍然可以作为大家练习使用的数据。为帮助各位练习,作者将部分数据进行拆解,以练习相应的函数。所提供的数据包含两个文件,一个是爬虫数据经过python处理后的源数据(文件一,csv格式),一个是企业的规模数据(文件二,xlsx格式)。
文件下载地址:链接:https://pan.baidu.com/s/1npfN2uHn-KD8UXwJtOgvFg
提取码:poj8
文件一的数据样例:
职位名称 | 公司名称 | 公司位置 | 薪资 | 学历要求 | 工作经验 | 招聘链接 |
---|---|---|---|---|---|---|
数据分析师 | 美团点评(中国大陆地区) | 北京-朝阳区 | 薪资面议 | 本科 | 1-3年 | https://jobs.zhaopin.com/CC383625322J00177851013.htm |
数据分析师 | 北京中公教育科技有限公司 | 北京 | 7K-12K | 本科 | 不限 | https://jobs.zhaopin.com/217000521263990.htm |
文件二的数据样例:
公司名称 | 公司规模 |
---|---|
美团点评(中国大陆地区) | 10000人以上 |
北京中公教育科技有限公司 | 10000人以上 |
威讯柏睿数据科技(北京)有限公司 | 20-99人 |
基于这份数据,要分析下招聘的信息,我会把具体的操作记录下来,方便各位按照分析的步骤练习。
数据处理
新建Excel文件(目标文件),使用数据导入功能将csv中的数据读入;将企业规模数据建立副本至目标文件。并将两个sheet分别命名为“源数据”和“企业规模源数据”
补充企业规模数据(用以练习vlookup函数),使用vlookup函数将企业规模数据匹配至源数据中;补充数据后,对数据进行简单探查,避免错误数据,使用筛选功能查看企业规模这一列数据中是否存在异常数据,筛选后发现某公司企业规模为0,查询企业规模源数据,发现企业规模为空,所以将0变更为未知。
职位名称 公司名称 公司规模 公司位置 薪资 学历要求 工作经验 招聘链接 数据分析师(电商平台) 北京京都酩悦贸易有限公司 0 北京 8K-10K 大专 1-3年 https://jobs.zhaopin.com/CC264512027J00241663210.htm 原始数据中,“公司位置”是城市-区域的方式,为分析公司在不同区的分布情况,所以将“公司位置”使用数据分列功能(分隔符为“-”)分为两列,方便后续分析。(tips:分列前,先新建空白列,避免对后续数据的影响)
具体操作如下:
将列重新命名为“城市”和“区域”
职位名称 | 公司名称 | 公司规模 | 城市 | 区域 | 薪资 | 学历要求 | 工作经验 | 招聘链接 |
---|---|---|---|---|---|---|---|---|
数据分析师 | 美团点评(中国大陆地区) | 10000人以上 | 北京 | 朝阳区 | 薪资面议 | 本科 | 1-3年 | https://jobs.zhaopin.com/CC383625322J00177851013.htm |
数据分析师 | 北京中公教育科技有限公司 | 10000人以上 | 北京 | 7K-12K | 本科 | 不限 | https://jobs.zhaopin.com/2170 |
剩余60%内容,订阅专栏后可继续查看/也可单篇购买
数据分析入门技术篇