数据分析秋招总结
等到学校发三方后,秋招基本就告一段落了。之前看到很多数据分析的小伙伴比较迷茫,贴一下自己在之前面试的一些经验和学习路程,算是对秋招画上一个圆满的句号。
楼主基本情况末流985本+中上流985硕,数学相关专业,之前有一段时间从头学习过一遍机器学习,主要是李航的统计学习理论和机器学习西瓜书,对算法理论进行过推导,由于之前的实习经历,算是学习过一些NLP相关基础知识,之前打算走机器学习或者NLP相关内容,但奈何代码能力不行,最后转行数据分析。
在3月份之前,都没有定下来自己要从事数据分析相关职业,之后觉得数据结构,代码什么的还有leetcode相关题自己实在力不从心,于是转战数据分析。大概3月份开始找数据分析相关实习,主要想去了解一下数据分析到底是做什么的,4月份入职一所互联网中厂数据分析。
在这之前,楼主只会基本的机器学习算法和sklearn建模以及pandas基础操作,3月份突击了一个月mysql就去面试了。实习面试主要问了pandas一些常规用法和sql基础知识,如左右连接和窗口函数。再加上之前有一段NLP相关实习,做了文本聚类分析,所以问了kmeans聚类相关内容,面腾讯的时候问了sql连接python的代码,sql建表等。
去实习之后,发现互联网数据分析一个非常重要的技能是sql,也就是大家常说的sql boy,另一个非常重要的技能就是对业务的理解能力,数据分析一定要有非常敏锐的也许洞察能力,才能让所分析的东西有价值,数据敏感度这种全靠平时业务积累,如指标涨跌异动等,能判断出为什么会有指标的变化,需要对数据维度进行不断拆分,找到问题来源。包括埋点文档梳理等,都是数据分析师的必备技能。
在互联网这段实习经历让我之前学习的技术得以了一定的应用,也明白了数据分析到底是做什么的,觉得自己还是挺感兴趣的,因此秋招依然选择了数据分析。
总结这段时间的经历,我觉得互联网数据分析师最重要的技能有下面几点
1.SQL:能够增删改查连表,熟练使用窗口函数casewhen等等操作,在工作中,很多数据需要sql提数,如果sql能力很强,会加大工作效率。
2.excel:不要小瞧excel,在你没有玩转明白各种函数数据透视表vlookup前,一定要好好学学excel,对于数据量不大的情况下,excel有时候会比pandas好用很多。
3.python:主要是pandas进行数据预处理,在数据量大的情况下,pandas清洗数据还是非常牛的。
4.机器学习基础:对常见的机器学习算法要能够了解原理,代码的话感觉能用sklearn调包就够了,当然不排除有些公司的数据分析和数据挖掘是在一起的,这时候可能需要更强的代码能力。
5.业务敏感度:对常见指标如DAU,uv,pv,ARPPU类似这种指标有所了解,如果某一指标下降,知道如何去挖掘原因,建议去人人都是产品经理网站读一些文章,有意者数据运营相关书籍也会系统讲解关于业务相关知识。
数据分析要学的很多,而且每个公司的要求都不一样,有的公司偏业务,有的公司偏技术,数据分析的同学有时候会很迷茫,感觉自己学了很多,却好像都是半吊子,业务能力比不上产品经理,代码能力比不上算法工程师,数据敏感度比不上运营同学,但一定不要放弃,数据分析是有他的价值的,如果我们可以踏实坚持的学习下去,一定会找到合适自己的岗位,数据分析一定会有它存在的价值,坚持不下去的数分同学,请在坚持一下,offer就在下一个路口等你!
#数据分析师#