24数分or数开求大佬指点

个人背景

985菜狗,没有拿得出手的项目背景(唯一和大数据相关的只有百度的SQLboy...),本硕均是管科出身,统计学、机器学习略懂,Python和SQL比较熟练(面向github编程),没有计算机基础(八股和后端开发技术)

困惑 -- 学数开赶得及秋招么?

数开的学习路线和职业前景也是稍有了解(卷的要死),还有几个月才秋招(暑期暂且不论),目前感觉数开和数分最好现在抉择,向一个方向深钻准备。做数开,本身基础太差,担心短时间补基础+项目可能秋招收益较低,也没有学习数开的方法论(就是进度安排,怎么做,做到什么程度)

困惑 --数分,看不清未来的路

目前来说,数开可信性更高,目前在百度的组有大量的业务文档可以学习,补习统计知识也比较轻松,但担心和业务深度绑定后,求职面会比较小,再转技术也没有余力了...

第一次在牛客上发贴,希望曾经有类似经历的前辈能多多指点,志同道合的朋友一起沟通,祝大家暑期顺利

ps:简历也请大家多多批评指导...以后也会持续发面经的(前提是能过初筛)

alt

#数据人的面试交流地##悬赏#
全部评论
数开吧,两个原因:1你有百度大数据研发的对口实习 2数分比数开更加红海,数分秋招学历卷到飞起,非华五都有可能被挂。。
16 回复 分享
发布于 2023-03-04 19:30 上海
这不得乱杀
5 回复 分享
发布于 2023-03-04 16:45 辽宁
大佬想问问数开一定要java吗?我java只学了皮毛语法,之前学分布式都用go写的,然后主要还是用py和sql
3 回复 分享
发布于 2023-03-15 00:20 上海
看了你的背景是主要以算法+sql为主。那就果断走数据分析。秋招保底中厂,可冲大厂
3 回复 分享
发布于 2023-03-09 20:15 广东
看技能似乎更偏数开 数分感觉更多是业务还有一些产品运营方面的东西 楼主有兴趣可以私聊一起交流哈
3 回复 分享
发布于 2023-03-04 15:57 上海
刚想鼓励下你的,仔细看了下经历技能,***你24届的比我这23届的强多了,快爬,你必找到工作
2 回复 分享
发布于 2023-03-08 15:11 天津
数开看看选哪个方向了,数仓方面肯定够的,你这也比较对口。平台开发的话估计时间有点赶。
2 回复 分享
发布于 2023-03-05 13:38 江苏
看看游戏行业?比如我们米哈游?哈哈哈可以看我主页
1 回复 分享
发布于 2023-03-10 10:05 上海
直接冲数开,没啥问题
1 回复 分享
发布于 2023-03-08 01:43 陕西
大佬 我和你本科同专业的 想问一下这方面读研的问题可以嘛
1 回复 分享
发布于 2023-03-06 15:28 广东
hello我也是本硕管科的 请问楼主最后选了什么
点赞 回复 分享
发布于 2023-12-06 14:12 北京
果断数开!!!背景乱杀
点赞 回复 分享
发布于 2023-03-24 15:27 辽宁
现在开始学数开还来得及
点赞 回复 分享
发布于 2023-03-24 12:26 北京
实习经历很不错,但是写得太简单了,可以再包装包装,要写出你做的事情,你用的方法,有什么产出
点赞 回复 分享
发布于 2023-03-08 20:35 北京
大佬我本科也是信管研究生管科,
点赞 回复 分享
发布于 2023-03-08 16:54 上海
数开招的都不多,害,不过有学历优势,应该能卷一卷
点赞 回复 分享
发布于 2023-03-07 12:02 北京
大佬这学历横着走了吧
点赞 回复 分享
发布于 2023-03-06 19:12 广东
数分真的很卷,而且现在实习方向也算和数开对口
点赞 回复 分享
发布于 2023-03-06 19:09 上海
可以互关交流下,同大数据开发,简历背景经历类似
点赞 回复 分享
发布于 2023-03-05 09:18 安徽

相关推荐

2025-12-28 14:46
已编辑
门头沟学院 大数据开发工程师
一面 1.自我介绍2. 最常耗时的一个SQL,怎么定位这个问题,包括怎么去做的优化。3. 有考虑过索引的优化吗?4. 同学在跑SQL的时候有没有explain这个SQL去看一下它的执行计划呢?5. 假如explain发现SQL执行计划没有错乱、没有不合理的情况,但实际上跑的还是很慢,同学有考虑过这是为什么吗?6. 同学怎么去判断到底是资源不足导致的慢,还是数据倾斜导致的慢呢?7. 能不能从Spark SQL的内部角度谈一下,一个SQL怎么从字符串变成最后可执行的task的?8. join的优化会影响在哪一层上吗?比方说a join b改成b join a,实际影响的是哪一层的执行计划9. 怎么去判断一个Spark任务是否存在倾斜10. 除了Spark UI,根据业务判断,可不可以从SQL特征上判断出数据倾斜呢?11. group by数据倾斜12. join的倾斜是怎么处理的,聚合的倾斜是怎么处理的。13. 加盐的话会有什么副作用吗?14. 加完盐之后能一次得到结果吗?15. 如果倾斜的key占到整个数据的大概70%,用broadcast的方式不行,同学会考虑怎么办呢?16. 在Spark内部,broadcast之后是怎么实现的?广播的数据存在哪儿?使用的是什么数据结构呢?17. 同学有了解过broadcast这张表过大的话,Spark会怎么去控制这个情况发生吗?18. 如果broadcast的阈值设置不合理,比方说设成了1G,会有什么情况发生呢?19. driver会因为broadcast表过大而发生OOM吗?20. orc相比text file,在执行层面会快在哪?为什么要用orc而不用text file,优势在于哪?21. 除了压缩、列式存储,orc文件的结构有什么特征吗?22. orc与parquet优势在哪,缺点在哪?。。。。。。实习相关内容36. 有一张员工表,字段是员工ID和薪资,希望通过SQL找到里面第二高的工资是多少?不用窗口函数该怎么实现呢?37. 同学有了解过Java的内存模型吗?38. 同学有了解过Java的hashCode和equals之间的关系吗?39. 同学有了解过Java的类加载器的相关内容吗?比方说分为几种类加载器,加载顺序是什么样的?40. 同学对垃圾回收机制有了解过吗?有了解过CMS和G1吗?41. CMS的缺点是什么呢?为什么它扫描时间会很久呢?CMS不是并发的吗?42. 同学常用的OLAP引擎是什么?43. 同学有了解过Doris的tablet是什么吗?44. Doris的分区和分桶有什么区别吗?45. 分区和分桶各有什么好处呢?46. 同学有了解过实时相关的概念吗?了解过Kafka的topic和partition之间有什么关系吗?47. Kafka里面的offset同学有了解过它是干什么用的吗?offset是全局的还是分区内的?48. 有一个场景:MySQL里有一张20亿数据的表,不使用任何数据同步组件(比如canal、maxwell、flink cdc等),怎么把数据从MySQL迁移到Hive或者Doris里面?49. 在读取MySQL数据做分批迁移的时候,怎么分片读呢?比方说表里面有一个时间字段,该怎么利用?编程题:二叉搜索树转化为双端链表二面1.自我介绍2.实习介绍3.数据治理怎么做的SQL题:已知数仓表 t 的结构包含:uid(int)vid(string)start_time(yyyy-mm-dd hh:ll:ss)end_time(yyyy-mm-dd hh:ll:ss)dt(分区字段)hour(分区字段)数据样例:uid=100043435,vid=f1ewmkflgkl2ds,start_time=2025-12-24 18:06:18,end_time=2025-12-24 18:17:25,dt=2025-12-24,hour=18。求出一天内每5分钟的视频播放量top10最终结果start_time    end_time    top1000:00            00:05        ....00:05            00:10        .........4.java抽象类和接口的区别5.什么情况用抽象类什么情况用接口5.java 中lock和synchronized的区别6.编程题:实现一个滑动窗口数据结构,支持实时评算窗口内的最大值、最小值和平均值。第二问:求最大值、最小值不用数据结构、排序、组内遍历,还有别的实现方式吗一面问麻了二面炸缸了
投递米哈游等公司8个岗位
点赞 评论 收藏
分享
评论
21
56
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务