字节大数据开发跨部门转正

一面(8.27)

  • 实习内容

还在职吗

实习期间主要干什么

和你对接的同学有哪些

产运和算法同学怎么使用你产出的数据

数据集底层用什么技术栈

你写SQL任务的时候是怎么优化代码的,写代码的时候哪些地方需要注意

有自己搭建过看板吗

知道SLA基线吗,有主动了解过吗

  • 大数据技术问题

一个spark任务怎么优化

发现写好的spark任务运行的很慢要怎么办

数据倾斜怎么处理

如果任务在读文件的时候运行很慢怎么办

内存利用率过低怎么办

CPU利用率过低怎么办

你经常用的spark参数还有哪些

  • SQL

table
有字段id user_id_list device_id_list app_id_list
写一段SQL将三个列表中的元素展开,并且元素需要一一对应(user_id_1 对应 device_id_1 对应 app_id_1)
最后的结果应该是id user_id device_id app_id的形式

这个SQL写完的结果数据量会变多吗

二面(8.29)

  • 实习内容

还在职吗

有独立做过需求吗

做过最难的需求是什么

你处理的数据量有多大

有接过实时的需求吗

Flink了解多少

有主动钻研过数据领域的技术吗

保障过SLA基线吗

保障SLA基线要从哪方面着手

生服这么缺人力为什么要跨部门转正呢

  • 场景题

如果一周给你定容了三个需求,你会怎么排期呢

如果你排期完成后,发现自己判断失误,这个需求在原定排期内做不完,你会怎么办

你觉得保障SLA基线最困难的点在哪里

  • SQL
table
两个字段 a b   代表了a关注了b
写一个SQL找到相互关注的用户(尽量高效)
table
student_id  course  score
1           语文     78
找出单个学科成绩第三名的同学的ID,总成绩和总成绩的全班排名
table
date        people
2025-08-01  141
2025-08-02  35
日期是主键,people代表当日人流量
找出连续三天人流量>100的date

三面(8.30)

  • 实习内容

还在职吗

你实习做过最难的需求,难在哪里

口径都是谁定的

你负责这块业务,团队的关注点在哪里

你负责这块业务每日gmv多少

你处理的数据量多大

你怎么做数据探查的

  • 场景题

你和产运同学,DS同学是怎样的合作模式

这个合作模式你觉得优点是什么,缺点是什么

你的职业规划

你是北方人,为什么去湖南读大学

为什么高考志愿选择计算机

为什么选择做数据

你平时喜欢逛什么社区

有看什么书吗

  • 大数据技术问题+计算机基础知识

HA高可用

zookeeper是什么

HDFS是什么架构

MapReduce的过程讲一下

三次握手四次挥手

进程和线程的区别

线程的通信安全是如何保障的

AI了解过吗

GPT 5刚发布,比上一代做出了哪些优化呢

  • SQL
table1 
id user_id 这两个字段为联合主键
table2
id order_id 这两个字段为联合主键
写一段SQL,求出id,user_id_cnt,order_id_cnt(效率越高越好)

hr面(9.1)

  • 唠嗑

还在职吗

实习学到了什么

你有在面其他公司吗

假如你有多个offer,你选择的标准有哪些

实习遇到最大的困难是什么

相比校招生,你的优势在哪里,缺点又是什么

base意向

意向(9.2)

-----------------------------------------------------------------------------------------------

意向之后就有了更多时间,根据自己的学习进度,后面可能会做一些大数据技术栈的分享吧。

全部评论
为什么每个人都问:还在职吗?字节ssp佬
1 回复 分享
发布于 09-04 14:45 北京
所以生服这么缺人力为什么跨部门转正
点赞 回复 分享
发布于 09-12 08:36 上海
太牛了
点赞 回复 分享
发布于 09-10 15:40 北京

相关推荐

1. 请先做个简单的自我介绍?重点介绍一下自己的相关经历,包括在学校参与过的数据相关项目。2. 你最近5年的职业规划是什么,能否详细的谈一下,特别是与用户增长数据分析的关联?3. 你应聘这个岗位的优势是什么?劣势是什么?(各说三点)请结合自身能力和数据分析知识谈谈。4. 为什么选择应聘我们公司?请具体阐述米哈游哪些方面吸引你投身用户增长数据分析岗。5. 能不能谈谈对我们公司产品和所在行业的了解?说说游戏行业用户增长数据分析的要点。6. 你期望的薪酬是多少?结合自身对该岗位的认知以及市场情况谈谈你的期望。7. 大学期间最喜欢哪一门专业课程?为什么喜欢这一门?该课程对用户增长数据分析有何帮助?8. 用三个词,总结一下这几年自己大学的经历?并说明每个词与数据分析学习的联系。9. 大学期间都参加过哪些社团或者学生组织?可否谈一谈?在其中有无涉及数据分析相关工作?10. 平时有什么兴趣爱好?有什么特长吗?这些兴趣爱好和特长如何助力用户增长数据分析工作?11. 搭建用户增长分析模型时,你认为宏观趋势视角下哪些关键因素需重点关注?12. 基于游戏内容视角构建指标体系,你会从哪些维度去考虑相关指标的选取?13. 站外触达视角下,如何确保构建的指标体系能有效反映触达效果?14. 与游戏项目组深度协作时,怎样准确提炼游戏行为动机并构建活跃归因?15. 从游戏阶段切入定位留存与流失的关键信号,你有哪些方法和思路?
点赞 评论 收藏
分享
数开岗,面的非常愉快一开始先介绍了面试流程1.自我介绍,挑实习经历讲一讲2.代码手撕3.八股考察4.QA环节直接介绍实习经历,没有自我介绍,讲了10分钟开始手撕。1.数据是真实数据吗2.来源系统是同一个系统吗了解了一下主要做的项目数据来源手撕:问了下比较熟的编程语言(java)连续子数组最大和多少知道虾皮是干嘛的吗SQL  求销量表,每个类别下售量TOP10的商品id排名连续怎么做衣服这一品类数据量特别多,导致数据倾斜怎么处理,只针对这一场景处理(二次聚合)给谁加随机值,怎么加,举例还有别的方法吗,只针对这个情景(压缩)你知道spark有做这件事吗(压缩)自己工作中会开这个配置吗spark和flink哪个比较熟,或者其他组件哪个学的好,可以自己挑个熟悉的来讲,还是随便挑个问1.flink状态后端知道哪些2.讲一下checkpoint是在干嘛3.如果状态后端是Rocksdb,checkpoint是怎么存的4.一个算子是怎么知道自己该做checkpoint5.从checkpoint恢复的时候,怎么做的6.一个算子,怎么知道恢复时应该读哪份文件7.看过checkpoint文件里面的结构吗8.有遇到过从checkpoint恢复时失败,是由于算子找不到从哪恢复的问题吗spark方面的问题1.executor, 他的内存分成几部分?堆内堆外内存区别为什么会有堆内堆外内存2.在shuffule的过程中,这几部分是否/如何参与其中3.节点0OM,我有哪些方法或者配置,去优化?最后反问总结,面试官全程态度超好,一直在说别着急,没问题,会有正反馈,体验最好的一次面试
查看29道真题和解析
点赞 评论 收藏
分享
10-13 11:50
门头沟学院 Java
京东零售 - 平台产研 - 营销页面供给技术 base上海timeline:9.5 一面 9.9约二面9.11二面 9.15约hr面9.27线下hr面10.13意向整体面试体验都挺好的,我爱东哥!😋附面经:一面:75min自我介绍1.实习拷打45min2.实习的表结构设计,建立什么索引了3.建立索引考虑哪些因素4.查询一个db很慢可能是什么原因5.索引底层是怎么实现的,那b+树具体有哪些特征6.用redis做过些什么7.分布式锁具体怎么去做的,原理?8.redis的持久化机制了解吗9.手撕实现从n个数组里随机取m个数反问二面:35min1.实习难点介绍(10min)2.说说离线和实时链路各自是怎么样的3.离线链路数据同步怎么做4.那么像bigquery,starrocks,postgreSql你业务上用会怎么选型,具体考虑哪些因素5.实习过程中线上监控是怎么做的,主要考虑业务上的指标监控(数据一致性,数据为空等)6.线上有没有碰到性能优化场景,怎么去分析7.业务方向的职业规划反问hr面:20min自我介绍1.考研保研,为什么选择现在这个学校2.平常关注哪些技术,喜欢什么方向3.实习时间蛮长的,导师允许吗4.腾讯有转正吗5.小米和腾讯文档差异,所以小米对新人培养会更好一点对吗(我说其实差不多6.觉得在小米还是腾讯挑战更大,为什么造成了我说的这些挑战7.为什么离开小米去腾讯了8.对工作业务有什么倾向性吗9.腾讯有明确的意向书吗10.和团队里同事们关系怎么样11.开发的时候关注文档沉淀和注释吗12.平常工作中开发的占比有多少,之前有预料到程序员是这种情况吗(需要大量沟通13.这一年来压力最大的事情反问
点赞 评论 收藏
分享
评论
7
19
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务