达不溜季

09-02 16:34 中南大学数据仓库发布于北京

关注

字节大数据开发跨部门转正

一面（8.27）

实习内容

还在职吗

实习期间主要干什么

和你对接的同学有哪些

产运和算法同学怎么使用你产出的数据

数据集底层用什么技术栈

你写SQL任务的时候是怎么优化代码的，写代码的时候哪些地方需要注意

有自己搭建过看板吗

知道SLA基线吗，有主动了解过吗

大数据技术问题

一个spark任务怎么优化

发现写好的spark任务运行的很慢要怎么办

数据倾斜怎么处理

如果任务在读文件的时候运行很慢怎么办

内存利用率过低怎么办

CPU利用率过低怎么办

你经常用的spark参数还有哪些

table
有字段id user_id_list device_id_list app_id_list
写一段SQL将三个列表中的元素展开，并且元素需要一一对应（user_id_1 对应 device_id_1 对应 app_id_1）
最后的结果应该是id user_id device_id app_id的形式

这个SQL写完的结果数据量会变多吗

二面（8.29）

实习内容

还在职吗

有独立做过需求吗

做过最难的需求是什么

你处理的数据量有多大

有接过实时的需求吗

Flink了解多少

有主动钻研过数据领域的技术吗

保障过SLA基线吗

保障SLA基线要从哪方面着手

生服这么缺人力为什么要跨部门转正呢

场景题

如果一周给你定容了三个需求，你会怎么排期呢

如果你排期完成后，发现自己判断失误，这个需求在原定排期内做不完，你会怎么办

你觉得保障SLA基线最困难的点在哪里

table
两个字段 a b   代表了a关注了b
写一个SQL找到相互关注的用户（尽量高效）

table
student_id  course  score
1           语文     78
找出单个学科成绩第三名的同学的ID，总成绩和总成绩的全班排名

table
date        people
2025-08-01  141
2025-08-02  35
日期是主键，people代表当日人流量
找出连续三天人流量>100的date

三面（8.30）

实习内容

还在职吗

你实习做过最难的需求，难在哪里

口径都是谁定的

你负责这块业务，团队的关注点在哪里

你负责这块业务每日gmv多少

你处理的数据量多大

你怎么做数据探查的

场景题

你和产运同学，DS同学是怎样的合作模式

这个合作模式你觉得优点是什么，缺点是什么

你的职业规划

你是北方人，为什么去湖南读大学

为什么高考志愿选择计算机

为什么选择做数据

你平时喜欢逛什么社区

有看什么书吗

大数据技术问题+计算机基础知识

HA高可用

zookeeper是什么

HDFS是什么架构

MapReduce的过程讲一下

三次握手四次挥手

进程和线程的区别

线程的通信安全是如何保障的

AI了解过吗

GPT 5刚发布，比上一代做出了哪些优化呢

table1 
id user_id 这两个字段为联合主键
table2
id order_id 这两个字段为联合主键
写一段SQL，求出id,user_id_cnt,order_id_cnt（效率越高越好）

hr面（9.1）

唠嗑

还在职吗

实习学到了什么

你有在面其他公司吗

假如你有多个offer，你选择的标准有哪些

实习遇到最大的困难是什么

相比校招生，你的优势在哪里，缺点又是什么

base意向

意向（9.2）

-----------------------------------------------------------------------------------------------

意向之后就有了更多时间，根据自己的学习进度，后面可能会做一些大数据技术栈的分享吧。

全部评论

推荐最新楼层

zhiyog

中南大学前端工程师

为什么每个人都问：还在职吗？字节ssp佬

1 回复分享

发布于 09-04 14:45 北京

哈希雾境

门头沟学院数据仓库

所以生服这么缺人力为什么跨部门转正

点赞回复分享

发布于 09-12 08:36 上海

街头DOM

门头沟学院大数据开发工程师

太牛了

点赞回复分享

发布于 09-10 15:40 北京

不愿透露姓名的神秘牛友

09-25 19:25

得物数仓一面

1.自我介绍2.实习的岗位的特色，和其他开发类型的岗位有什么区别3.实习公司数仓建模的分层逻辑，如果接到一个需求如何判断应该在哪个分层，举例说明4.数据倾斜如何处理，举例说明5.流量归因转化是怎么做的6.实习项目背景，如何设计前端看板，如何支持业务需求7.对 flink 的了解8.工作中遇到的困难如何处理，举例说明9.在项目中有什么事情是需要你花工作之外的时间解决的吗，你如何处理这种事情？10.为什么想来得物？11.你之前实习的领导对你有什么意见或者建议吗？12.你之前的团队分工如何，你认为合理吗？13.工作中遇到冲突怎么办？14.sql：取中位数

点赞评论收藏

10-15 11:28

上海外国语大学财务

米哈游用户增长数据分析面经

1. 请先做个简单的自我介绍？重点介绍一下自己的相关经历，包括在学校参与过的数据相关项目。2. 你最近5年的职业规划是什么，能否详细的谈一下，特别是与用户增长数据分析的关联？3. 你应聘这个岗位的优势是什么？劣势是什么？（各说三点）请结合自身能力和数据分析知识谈谈。4. 为什么选择应聘我们公司？请具体阐述米哈游哪些方面吸引你投身用户增长数据分析岗。5. 能不能谈谈对我们公司产品和所在行业的了解？说说游戏行业用户增长数据分析的要点。6. 你期望的薪酬是多少?结合自身对该岗位的认知以及市场情况谈谈你的期望。7. 大学期间最喜欢哪一门专业课程？为什么喜欢这一门？该课程对用户增长数据分析有何帮助？8. 用三个词，总结一下这几年自己大学的经历？并说明每个词与数据分析学习的联系。9. 大学期间都参加过哪些社团或者学生组织?可否谈一谈？在其中有无涉及数据分析相关工作？10. 平时有什么兴趣爱好？有什么特长吗？这些兴趣爱好和特长如何助力用户增长数据分析工作？11. 搭建用户增长分析模型时，你认为宏观趋势视角下哪些关键因素需重点关注？12. 基于游戏内容视角构建指标体系，你会从哪些维度去考虑相关指标的选取？13. 站外触达视角下，如何确保构建的指标体系能有效反映触达效果？14. 与游戏项目组深度协作时，怎样准确提炼游戏行为动机并构建活跃归因？15. 从游戏阶段切入定位留存与流失的关键信号，你有哪些方法和思路？

点赞评论收藏

09-27 16:41

中国地质大学（武汉）大数据开发工程师

虾皮一面

数开岗，面的非常愉快一开始先介绍了面试流程1.自我介绍，挑实习经历讲一讲2.代码手撕3.八股考察4.QA环节直接介绍实习经历，没有自我介绍，讲了10分钟开始手撕。1.数据是真实数据吗2.来源系统是同一个系统吗了解了一下主要做的项目数据来源手撕：问了下比较熟的编程语言(java)连续子数组最大和多少知道虾皮是干嘛的吗SQL  求销量表，每个类别下售量TOP10的商品id排名连续怎么做衣服这一品类数据量特别多，导致数据倾斜怎么处理，只针对这一场景处理(二次聚合)给谁加随机值，怎么加，举例还有别的方法吗，只针对这个情景(压缩)你知道spark有做这件事吗(压缩)自己工作中会开这个配置吗spark和flink哪个比较熟，或者其他组件哪个学的好，可以自己挑个熟悉的来讲，还是随便挑个问1.flink状态后端知道哪些2.讲一下checkpoint是在干嘛3.如果状态后端是Rocksdb，checkpoint是怎么存的4.一个算子是怎么知道自己该做checkpoint5.从checkpoint恢复的时候，怎么做的6.一个算子，怎么知道恢复时应该读哪份文件7.看过checkpoint文件里面的结构吗8.有遇到过从checkpoint恢复时失败，是由于算子找不到从哪恢复的问题吗spark方面的问题1.executor, 他的内存分成几部分?堆内堆外内存区别为什么会有堆内堆外内存2.在shuffule的过程中，这几部分是否/如何参与其中3.节点0OM，我有哪些方法或者配置，去优化?最后反问总结，面试官全程态度超好，一直在说别着急，没问题，会有正反馈，体验最好的一次面试

查看29道真题和解析

点赞评论收藏

10-16 20:03

华北电力大学（保定）大数据开发工程师

10.16字节数据开发一面

60min左右自我介绍+实习经历介绍一下shufflespark性能优于mapreduce的原因介绍一下宽窄依赖HDFS小文件问题在实习过程中处理过任务优化吗？大数据倾斜问题怎么处理？spark调优手段？Flink的Watermark机制TCP 和 UDP可以简单介绍一下三次握手吗？数据库里边为什么要使用索引B树跟B+树有什么区别点？B+数还有什么特性吗？索引在哪些情况下会失效？介绍一下python深浅拷贝多态了解吗？Java里边的hashmap了解过吗？代码考核一道sql+一道算法题sql：找出至少连续两天在线的用户数算法题没做出来..面试官人很好一直在提醒我，但是还是没做出来..我一直哭继续刷leecode去了

查看17道真题和解析

点赞评论收藏

10-13 11:50

门头沟学院 Java

秋招第三个意向 - 京东

京东零售 - 平台产研 - 营销页面供给技术 base上海timeline：9.5 一面 9.9约二面9.11二面 9.15约hr面9.27线下hr面10.13意向整体面试体验都挺好的，我爱东哥！😋附面经：一面：75min自我介绍1.实习拷打45min2.实习的表结构设计，建立什么索引了3.建立索引考虑哪些因素4.查询一个db很慢可能是什么原因5.索引底层是怎么实现的，那b+树具体有哪些特征6.用redis做过些什么7.分布式锁具体怎么去做的，原理？8.redis的持久化机制了解吗9.手撕实现从n个数组里随机取m个数反问二面：35min1.实习难点介绍(10min)2.说说离线和实时链路各自是怎么样的3.离线链路数据同步怎么做4.那么像bigquery，starrocks，postgreSql你业务上用会怎么选型，具体考虑哪些因素5.实习过程中线上监控是怎么做的，主要考虑业务上的指标监控（数据一致性，数据为空等）6.线上有没有碰到性能优化场景，怎么去分析7.业务方向的职业规划反问hr面：20min自我介绍1.考研保研，为什么选择现在这个学校2.平常关注哪些技术，喜欢什么方向3.实习时间蛮长的，导师允许吗4.腾讯有转正吗5.小米和腾讯文档差异，所以小米对新人培养会更好一点对吗（我说其实差不多6.觉得在小米还是腾讯挑战更大，为什么造成了我说的这些挑战7.为什么离开小米去腾讯了8.对工作业务有什么倾向性吗9.腾讯有明确的意向书吗10.和团队里同事们关系怎么样11.开发的时候关注文档沉淀和注释吗12.平常工作中开发的占比有多少，之前有预料到程序员是这种情况吗（需要大量沟通13.这一年来压力最大的事情反问

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 从哪些方向判断这个offer值不值得去？ #

12906次浏览 159人参与

# 度小满求职进展汇总 #

11914次浏览 64人参与

# 你觉得mentor喜欢什么样的实习生 #