【数据分析】秋招经验分享

秋招过程中在牛客社区受益颇多,所以希望能写点东西回馈社区的大家。这篇帖子主要讲讲秋招的个人经验和对行业的理解,希望能抛砖引玉,找到同样热爱数分的战友来共勉。

【笔面试准备方法】
要回答"如何拿到理想的数据分析offer"这个问题,首先需要定义"什么是理想的数据分析offer",其次才是考虑"如何拿到这个offer"。前者涉及评价一个数据分析职位的标准,可以从行业、成长空间、薪酬等维度来判断,最终取决于个人的兴趣和职业目标;后者才是讲具体的笔试面试方法。因而我会主要分享两方面内容:1)在实操层面上如何准备笔面试 2)对数据分析在不同行业的情况的理解,以及职业前景。这两方面分别针对还在求职的小伙伴和已经在offer比较阶段考虑未来职业规划的朋友。

从实操层面上来讲,互联网企业的数据分析主要要求以下几方面的技能:
1)概率统计:包括概率论和统计推断,掌握常见概率分布、抽样以及假设检验方法即可。除了了解基本概念外,最好能总结下各个方法的应用条件、优缺点,以及改进方法,这样可以将类似的概念横向对比,加深理解。
2)编程:主要是SQL和基础python编程,也有部分大厂会考察算法编程。对于SQL来说要特别关注一些热点问题,比如rank()、dense_rank()、row_number()的区别,常见的数据倾斜原因和解决方法,以及常见的SQL调优方法。
3)机器学习:主要是经典机器学习和数据挖掘算法,不包括各类深度学习算法。这一块也要特别关注相应的热点问题,比如XGBoost、LightGBM相比传统树型算法的改进和优缺点。
4)产品/运营/商业 思维:主要考察产品/运营优化过程中的常见问题,比如异常指标归因分析、活动效果评价等。产品思维这一块最好能依托自己熟悉的产品进行全面梳理,比如如果喜欢用抖音快手的话就可以深入了解下短视频UGC赛道的市场环境、商业模式、运营指标等等。
5)跨部门沟通协作能力:主要考察对分析师职能和实际工作流程的理解,通常在终试和HR面中被问到。

注重归纳总结
总体来说除了"跨部门沟通协作能力"需要个人亲身经历感悟之外,其他几项都能通过"刷题"来解决。所谓"刷题"就是归纳总结常见问题,这一点要感谢各位牛友的分享,因为实际笔试面试中的绝大部分问题大都能在牛客的笔面经帖里找到。
我认为对于即将成为分析师的我们来说归纳总结能力格外重要,而准备笔面试的过程就是第一个考验。归纳总结可以帮助理清思路,得到方便记忆的结论。比如下面这个例子:
-----------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------
类似地还可以对以上各个方面进行归纳总结,以下再列几个例子供大家参考:
1)归纳总结各种假设检验方法的作用、适用条件、优缺点,以及相应的改进方法
2)归纳总结SQL中各种排序函数的用法、性能、区别
3)归纳总结AARRR模型中各个阶段的常用指标

我们其实可以把"归纳总结常考题型"这个行为理解为重建"笔面试题目"这个随机向量的概率密度,即基于牛客笔面经帖的采样来重建(概率&统计, 编程, 机器学习, 产品/运营/商业思维, 跨部门沟通协作能力)这个5维随机向量的联合概率分布,然后找到概率最大的一批往年考题就是常考的试题。这5个维度的变量很大程度上是相互独立的,所以我们只需要分别找到每个维度的高概率试题再分别准备就可以了。当然这个过程中不会很顺利,因为我们在牛客看到的全部笔面经帖很可能不是总体的无偏采样:不同公司不同年份的数据分析师岗位考察的问题可能并非同分布的,而且牛友在分享笔面经的时候可能会因为各种因素漏掉某些考题,因而需要重点关注高频题的同时对低频题也给一些最低限度的照顾。简单来说就是笔面经帖子里出现过的题目可以区别对待,但是必须都要有基本了解,切忌因为某些问题只出现过一次就不准备了(期末往往是什么没准备就考什么,血的教训...)

注意技术细节
除了被动地对面试官所提问题给出及格回答外,主动提及一些技术细节也能加分不少。在大多数人都只对算法原理懂个大概的时候,技术细节可以产生很好的区分效果。比如下面几个例子:
1)假设检验中影响统计功效的有哪些变量?
2)正则化的统计理论依据是什么?
3)极大似然估计和最大后验概率估计的关系是什么?
4)数据不平衡时能否用AUC作为评估指标?
5)能否直接用AUC评价SVM的性能?
类似的细节问题还有很多,常考的那些题目真的只是冰山一角,感兴趣的朋友可以进群交流。链接放在了一楼,大家后面可以聊聊笔面经和offer对比。

【数据分析的职能定位】
"对数据分析的理解"也是面试中常考的问题,但这个问题往往默认了互联网行业这个前提。实际上如果从各个行业整体来看数据分析的定位就会有不一样的理解。
基于个人经历和前辈们经验,目前数据分析在几个主要行业的情况如下:
行业 职能定位&工作内容 特殊技能要求
互联网 支持产品/运营/算法团队 可能要求熟悉linux、大数据生态工具
零售
供应链:
1.独立负责供应链分析
2.或支持供应链管理团队
运筹优化、对供应商/物流/仓储等业务的布局情况高度熟悉
Marketing&Merchandising:
1.独立负责市场/用户分析、定价等问题
2.或支持销售团队
市场/用户研究等经管专业的技能
E-commerce(互联网零售):
支持产品/运营/算法团队
比如沃尔玛的线上零售业务,这一块在国内完全被电商取代
---
咨询 独立负责行业分析业务 市场/用户研究等经管专业的技能
制药 独立负责临床实验相关数据分析 制药及临床实验的一般性常识、SAS或R
银行 独立负责风控相关数据分析业务 风控的一般性常识、SAS或R
制造 独立负责QA、最优化等任务 QA常识、运筹优化
以上几个行业的数据分析除了都用到统计技术之外几乎没有什么相同点,因而数据分析是一个高度依赖业务和行业的职业。因为互联网产业的高增长和庞大的用户体量,所以提到数据分析大家一般会默认是互联网行业。但是凡事没有最好,只有是不是最适合自己。非互联网行业的外企及银行可以提供稳定的工作节奏以及"工作-生活"平衡,这些都是互联网比不了的。此外传统行业除了零售等少数消费互联网的赛道能被"互联网+"模式打破壁垒外,绝大多数赛道的行业壁垒依然存在,比如制药、精密制造。如果对特定行业感兴趣的话毕业直接进入相关行业内扎根是最好的选择,而且外企一般有完善的管培机制,长期来看很适合走管理路线。总体来说互联网行业的数据分析师的基本定位是支持性角色,一般对接产品团队做需求分析,或负责运营数据监控。根据业务和职能的不同,有些分析师还承担协助开发数据中台的工作,或者自主搞数据挖掘,主动与业务方协商项目。
#数据分析##面经##学习路径##数据分析师#
全部评论
感谢楼主分享,收获颇丰,求拉进群,进一步学习呀🤩🤩🤩🤩🤩🤩🤩🤩
1 回复
分享
发布于 2020-09-25 20:45
进群申请 ~ 谢谢~
1 回复
分享
发布于 2020-11-17 16:34
阿里巴巴
校招火热招聘中
官网直投
楼主超棒!
点赞 回复
分享
发布于 2020-09-23 00:27
楼主求进群!感谢!
点赞 回复
分享
发布于 2020-09-23 04:16
感谢楼主!求拉群!
点赞 回复
分享
发布于 2020-09-23 04:22
可以进群吗!
点赞 回复
分享
发布于 2020-09-23 06:30
我想进群🙋‍♂️
点赞 回复
分享
发布于 2020-09-23 07:07
楼主太棒了!向楼主学习!
点赞 回复
分享
发布于 2020-09-23 10:25
楼主求进群。
点赞 回复
分享
发布于 2020-09-23 10:58
太厉害了吧!
点赞 回复
分享
发布于 2020-09-23 11:04
感谢楼主分享!!
点赞 回复
分享
发布于 2020-09-23 11:08
求进群~~
点赞 回复
分享
发布于 2020-09-23 11:10
得到了很多启发,受益匪浅!
点赞 回复
分享
发布于 2020-09-23 19:47
楼主二维码可能被屏蔽了没看到 求进群
点赞 回复
分享
发布于 2020-09-23 22:03
想要楼主的整理材料!谢谢!
点赞 回复
分享
发布于 2020-09-24 10:54
求进群!谢谢
点赞 回复
分享
发布于 2020-09-24 11:00
好奇的问下,楼主是不是之前也写了机器学习、数据挖掘和数据分析三个工作方向的内容😂
点赞 回复
分享
发布于 2020-09-24 13:06
楼主,求进群,想学习!
点赞 回复
分享
发布于 2020-09-24 13:23
求拉群,谢谢!
点赞 回复
分享
发布于 2020-09-24 14:12
感谢楼主分享,求进群~
点赞 回复
分享
发布于 2020-09-24 15:30

相关推荐

投递时间:2024年3月8日-2024年7月1日岗位职责毕业要求:2025届【招聘岗位】算法工程师(运筹优化、强化学习、推荐系统、NLP、机器学习、深度学习方向)【团队介绍】 阿里巴巴- 阿里云智能-弹性计算是 阿里云飞天平台( 阿里云 自研云计算操作系统)的核心,在全球有超过200个数据中心,19个地域,为全球数10亿用户提供着可靠的计算服务。 我们管理着海量物理机和虚拟机,提供超大规模服务编排能力,如果你想挑战高并发、强事务的业务场景,且利用深度学习、机器学习等前沿技术支持调度场景,欢迎加入ECS弹性计算-智能引擎团队。【工作内容】 在阿里云-弹性计算-智能引擎团队,你可以:1. 利用 运筹优化 及 强化学习 设计调度模型,参与建设国内最大规模的调度系统,承载每天百万次的 ECS 调度决策,为每台 ECS 选择最适合的宿主机2. 运用深度学习、机器学习等算法模型,分析TO B端用户在各个区域不同产品的购买行为和趋势,分析用户体验、支持智能化售卖推荐系统、NLP文本挖掘等场景3. 参与用户增长场景,时序预测、用户分群聚类、推荐系统等算法能力的研发【岗位要求】1. 2025年毕业的本、硕、博,计算机、数学、电子工程、通信、信息系统、统计学等相关专业;2. 熟悉常用机器学习算法,了解运筹优化、模式识别、深度学习、强化学习、推荐系统、NLP等一个或多个相关领域;具有一定的算法实现能力,掌握C/C++、Java、Python等至少一门编程语言;3. 候选人有数理分析方面良好的素养以及数理统计基础;4. 良好的数据敏感能力、较强的逻辑分析能力;5. 有实际成果并发表在国际顶级会议(CCF)、期刊者(SCI、SSCI)优先,有在KDDCUP、ImageNet、MSCOCO、ICDAR等权威比赛中取得优异成绩者优先。6. 有deeplearning经验、大规模数据处理经验优先,以及国内外互联网公司实习经历的优先。7. base:杭州、北京【岗位链接】https://www.nowcoder.com/jobs/detail/314714?jobId=314714https://www.nowcoder.com/jobs/detail/314713?jobId=314713
点赞 评论 收藏
转发
投递时间:2024年3月21日-2024年5月31日岗位职责岗位职责:利用机器学习算法处理海量数据,提升高德打车的司乘体验、服务质量及平台效率。 加入我们了解亿级用户最真实的出行体验、解决复杂业务场景中的技术难题!利用轨迹、文本、语音等多模态数据,对行程中各类问题进行识别及治理,包括但不限于LLM、多模态融合、NLP等技术团队简介:1、团队技术过硬:团队大牛云集,有来自伯克利、哈佛、清华、北大等名校的各路师兄师姐。2、一对一辅导,学习氛围好:每周固定技术分享,组内师兄师姐都很nice,不仅解答算法问题,分享项目经验,更传授解决问题的方法论和业务理解能力。3、业务前景好:团队支持共享出行业务所有算法项目,丰富的业务场景赋予算法更多的应用空间,我们积累了深厚的算法迁移、落地和创新能力,涉及众多领域,包括图神经、强化学习、因果推断、运筹优化、推荐系统等,同时也发表了AI顶会论文。岗位要求1、面向25年应届毕业生(毕业时间2024.12-2025.10)2、算法:有扎实的数据结构、机器学习、深度学习算法基础,包括但不限于机器学习、深度学习、NLP、多模态融合、大模型等(ICL/SFT/agent等);3、工程:熟练掌握Python,有使用sklearn、TensorFlow等工具的经验。掌握海量数据处理技术,包括但不限于Hadoop/Hive/Spark;4、素质:热爱出行行业,沟通协作意识好,落地能力强。
点赞 评论 收藏
转发
165 737 评论
分享
牛客网
牛客企业服务