09-22 16:23 中国科学技术大学大数据开发工程师发布于安徽

关注

字节集团信息数据开发一面0922

70分钟

1.自我介绍

2.业务复盘和收获

3.spark的reduce阶段

4.核心表和拓展表的建设

5.模型的健康度

6.数据治理

7.应用层直接引用ods层会有什么问题？怎么解决？

8.对于spark的参数调优

9.对于数据倾斜，spark自身的优化有哪些

10.提到的AQE会对占比70%这种的极端数据倾斜做哪些处理

11.这个过程叫什么join

20分钟手撕

会话日志表（未按时间戳排序），两个字段：user_id，create_ts（时间戳），时间戳间隔小于30秒的为有效会话，超过30秒会认为是无效会话，如果是单个记录会认为是1秒的会话。请输出表，记录有效会话信息，user_id，keep_ts（会话时长），start_ts（开始时间），end_ts（结束时间）。

例子：

user_id，create_ts

1，1000

1，1010

1，1003

1，1070

2，1000

2，1005

输出：

user_id，keep_ts（会话时长），start_ts（开始时间），end_ts（结束时间）。

1，10，1000，1010

1，1，1070，1070

2，5，1000，1005

全部评论

推荐最新楼层

牛客829816986号

南京航空航天大学 Java

请问是base哪里的

点赞回复分享

发布于 09-22 16:27 江苏

09-05 22:16

已编辑

东南大学 Java

字节跳动-广告业务-一面

实习：介绍一下实习实习中做了什么东西八股：java的线程是怎么运行的java线程池的底层原理Mybatis有什么作用Mybatis的缓存架构tcp和udp的区别手撕：判断一个树是不是平衡二叉树

查看7道真题和解析

点赞评论收藏

分享

09-22 12:51

武汉大学 Java

字节后端开发者服务一面

预计的是45分钟，最后被拷打了75分钟，算法题没有页面，让我本地操作1. 介绍什么是IOC（控制反转）？2. 介绍什么是AOP（面向切面编程）？3. 运行时如何判定一个对象的类型？具体怎么用？4. 能否通过反射拿到class上所有的方法（包括私有方法）？静态变量可以获得吗？5. 反射能获取私有方法时，作用域范围是什么？能否调用私有方法？6. 反射中setAccessible的意义是什么？7. 私有方法可被反射获取，是否会导致私有属性/方法的安全问题？这种情况合理吗？8. MySQL索引的实现原理有哪些？9. 用过explain吗？介绍其返回结果中主要字段的意义。10. explain结果中的filter字段代表什么？11. 基于“主键为xxxid，查询未删除（软删，有deleted_at字段）的数量，explain显示扫描10条，filter命中50%”的场景，说明SQL执行时做了哪些事情？12. 从binlog层面介绍上述SQL执行过程中的相关操作。13. 介绍缓存穿透的解决方案及相关经验。14. 比较Spring和Spring Boot的区别。15. 标准Web项目（如基于Spring MVC的HTTP服务）中，Spring Boot提供了哪些模块来实现相关能力？其集成能力如何？16. 如何在Spring中连接MySQL？具体连接过程（初始化时机、初始化方式）是怎样的？17. 为什么需要Mybatis这类ORM框架？它相比“裸写SQL”有什么优势？18. 项目中如何模拟超卖？模拟的QPS量级和库存设置是多少？19. 介绍“一锁二判三更新”的实现方式及逻辑。20. 若Redis在执行过程中掉电或集群网络短暂中断，如何恢复数据？如何保证数据一致性？是否存在不一致的时机？21. 数据校对过程的时效、实现方案是什么？22. 如何用Java实现一个简易消息队列？（要求：支持单个topic、单写多消费、最多100条消息，需处理写入速率超过消费速率的问题，暂不考虑持久化）23. 为何将“丢弃最老消息”作为消息队列满时的拒绝策略？该策略适合什么场景？哪些应用的MQ会侧重时效性？24. MQ适合的场景有哪些？在容量有限的场景下，延迟消息和削峰填谷场景分别适合什么拒绝策略？25. 了解HTTP请求从发起至服务器的完整链路吗？26. 用空间复杂度O(1)的方案实现IP地址按点反转（如192.0.1.2反转为2.1.0.192），写出代码并讲解思路。27. 面试收尾环节，询问候选人是否有问题。

查看27道真题和解析

点赞评论收藏

分享

09-25 16:34

门头沟学院前端工程师

9月初就完成了hr面，说什么没问题等后续oc结果等到现在啥也没有，一去官网看给我挂了

点赞评论收藏

分享

09-23 20:21

已编辑

门头沟学院大数据开发工程师

字节跳动数据开发国际化数据平台一面面经

更新：已经面完了，希望不要一面凉75min 好长啊，嗓子要哑了两个题判断四点是否能构成平行四边形判是否为“竖线”，然后判是否重合，y轴之差是否一致否则判斜率相等，b是否不相等（不相等等价于不重合），x轴之差是否一致然后交流了半天思路给定两个JSON，尽可能多的输出不一样的地方递归搜索概念性八股问的比较散，操作系统什么的。。。（忘了XD）---然而还没面，希望不要一面凉起码让我体验体验二面的感觉呢OAOPS：如何让牛客多推点流呢，我只是想找大佬交流呜呜

查看2道真题和解析

点赞评论收藏

分享

09-21 22:56

杭州电子科技大学大数据开发工程师

字节大数据开发一面面试题(有点意思)

1.自我介绍，项目介绍2.详细讲一下DWM、DWT、DWS这些层的具体职责和它们之间的数据流向3.如果你的DWS层的某个指标突然不准了，你会怎么排查定位问题？你平常怎么做血缘追踪？用的是哪套工具4.能不能举个具体业务场景，说一下是怎么解耦的，带来了哪些好处5.ODS到DWS的过程中你如何保证数据质量6. 在Hive上处理过什么级别的数据量？任务最长耗时是多少？怎么优化的7.如果Hive一个任务执行特别慢，你会怎么排查问题8.你说你熟悉Flink-sql，那你讲讲Flink是如何实现Exactly Once的？Flink的状态是怎么管理的9.Kafka异常数据你是怎么处理的？如果某个topic滞...

查看22道真题和解析

点赞评论收藏

分享

评论

1

4

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI创作大赛：牛可乐的国庆之旅 #

13077次浏览 189人参与

# 材料专业可以靠半导体脱坑吗？ #

23183次浏览 129人参与

# 携程求职进展汇总 #

636422次浏览 4648人参与

# 通信硬件人社招/春招/实习投递现状 #

29447次浏览 946人参与

# 国庆假期，给大脑放个假 #

1680次浏览 22人参与

# 大学四年该怎么过，才不算浪费时间？ #

12202次浏览 72人参与

# 深信服秋招来了 #

270859次浏览 2905人参与

# 五一假期，你打算“躺”还是“卷”？ #

80488次浏览 715人参与

# 你小时候最想从事什么职业 #

121318次浏览 1891人参与

# 海康威视求职进展 #

106334次浏览 515人参与

# 网申一定要掌握的小技巧 #

13087次浏览 74人参与

# 2025，我想...... #

73054次浏览 606人参与

# 长江存储求职进展汇总 #

57296次浏览 227人参与

# 国庆放假，你还会投简历吗？ #

9738次浏览 108人参与

# 牛友的国庆旅行碎片 #

6742次浏览 56人参与

# 国庆放假，你还会主动学习吗？ #

13814次浏览 67人参与

# 查收我的offer竞争力报告 #

215379次浏览 1397人参与

# 你认为工作的意义是什么 #

184210次浏览 1148人参与

# 你认为哪个岗位找工作最卷 #

51233次浏览 228人参与

# 设计人如何选offer #

151713次浏览 795人参与

# 距离放假还有_天，我已经…… #

15192次浏览 186人参与

# 教师节，你送祝福了吗 #

6070次浏览 52人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务