2024届秋招总结

互联网:

京东物流-数据研发工程师-离线数仓(8.14 16:00)

一面30min:

1.数仓分层

2.数据治理

3.业务使用的内部表和外部表

4.数据倾斜是怎么处理的

5.三道sql(join,group by,rank窗口函数、ddl语句删表和删分区)

快手-主站-数据开发工程师

一面(通用面)-40min(8.17 11:00)

1.介绍美团项目

2.数仓分层

3.join的mr过程

4.SQL:pv和uv的计算

5.python题:装饰器模式

6.Java题:浮点数开平方、二叉树的层序遍历

二面(通用面)-45min(8.22 14:00)

1.介绍一个最满意的项目

1.1用没用过别的解析工具,知不知道spark用什么解析的,calcite对比

1.2分层建模理论

2.数仓分层理论

3.DWD层,不同主题域是怎么划分的

4.如果建立一个业务数仓,你会考虑哪些问题,开放式

5.Java:有哪些类型的内存结构,堆和栈的区别

6.算法题:找前k大的数,堆排和快排适用情况

7.如何遍历一棵树,前中后序遍历的区别,访问者模式

三面(主管面)-45min(8.29 16:00)

1.数据治理都要做什么?

2.拉链表是什么以及应用场景

3.维度建模理论

4.SQL解析的流程

5.hadoop和spark的区别

6.数据倾斜的场景和解决方案

7.数据湖和流批一体

百度-小度-数据开发工程师(提前批)

一面(KPI,没开摄像头)-45min(8.21 14:00)

1.手撕算法,区间

2.介绍项目,groupingsets

2.1谁在用

2.2目的

2.3效果,和谁比,指标是什么

小红书-数据开发工程师-社区和商业化数仓

一面-1h(9.2 10:00)

1.数仓分层,被challenge在ODS层做公共逻辑下沉,万一数据***掉了怎么办?放在DWD行不行?

2.全链路归因建设的流程?服务端和客户端交互?

3.spark查询的优化?数据倾斜

4.leetcode:用队列来实现栈

5.SQL:查询累计登录天数、连续登陆天数

二面-40min(9.2 11:10)

1.业务背景是什么,被challenge为什么要用hive离线计算进行预计算,不直接用OLAP

2.如何去推动大家去使用这个平台,现在进展是怎么样的

3.为什么count(DISTINCT)转换为bitmapunion就能实现指标的逐层上卷

4.你怎么看待数据赋能业务

字节跳动-数据开发工程师-商业化数仓

一面-45min(9.12 11:00)

1.数据倾斜

2.spark为什么比mr快

3.OSI七层模型

4.TCP和UDP协议的区别

5.数据库索引的数据结构,为什么使用B+树

6.bitmap count distinct

7.基于hash的shuffle和基于排序的shuffle的区别*

腾讯-数据开发工程师-游戏广告

一面-1h(9.19 19:00)

1.项目中遇到的最困难的点

2.排序算法都有哪些分类标准

3.哪些算法是稳定排序

4.堆排序的时间复杂度是怎么样的

5.归并排序用到了什么数据结构、堆排序用到了什么数据结构?

6.聚簇索引和非聚簇索引的区别

7.索引使用了什么数据结构、为什么索引要使用相应的数据结构

8.索引的优劣势

9.解释一下spark中的RDD,哪些操作会导致计算的执行

10.如何解决数据倾斜,广播算法如何解决数据倾斜

11.除了kimball,还有哪些数据仓库的建模理论

12.tcp协议和udp协议相比为什么是安全的

13.如果有一个非常大的数据包,如何保障它被安全发送

14.io多路复用

15.进程间和线程间的通讯方式

16.如何处理最近30天订单量类似的表设计问题

17.Spark ui中有哪些东西,定位数据倾斜,如何优化

京东-数据开发工程师-零售数据中台

一面-30min(9.22 15:00)

1.http和https的区别

2.数仓为什么要分层

3.接口和抽象类的区别

二面-45min(9.26 17:00)

1.数开八股

2.研究方向

滴滴-数据开发工程师-DT

一面-40min(9.23 10:00-11:00)

数开常见八股,忘了

二面-50min(9.23 11:10)

1.hadoop小文件的影响

2.hadoop nn第一次和第二次启动的区别(fsimage和edits)

3.hadoop shuffle过程的三个阶段

4.hadoop数据倾斜及解决

5.spark的宽窄依赖

6.B树和B+树的区别

7.Spark的持久化&Checkpoint

8.数仓建模理论

9.数仓分层理论

10.数据库三大范式

华为-大数据开发工程师-ICT公共开发部

一面-40min(10.11 15:20-16:00)

1.响应码200,400,500含义

2.常见数据结构

3.常见排序算法

4.mysql常见引擎,区别

5.mysql索引

6.手撕:判断一棵树是不是查找树,递归

二面-50min(10.11 16:10-17:00)

1.深度挖简历,每一段实习都干了什么

2.手撕:给定两个二进制字符串,实现二进制加法

三面-50min(10.11 17:10-18:00)

1.最困难的一件事

2.职业规划

3.对华为有哪些了解

4.研究方向

5.兴趣爱好

阿里云智能集团-全面风险管理-安全数据-数据开发工程师

分享一道SQL题(不知道合不合适)

用户规格表(user_spec):

用户分钟业务表(user_value):

两张表,user_spec为用户购买的最大规格表,user_value为用户实际业务使用表(每分钟一条记录,存储的为时间戳)。

一、 获取每个用户的业务峰值和对应时间点

二、 获取用户超规格的时间点(如果某个时间点业务使用量大于规格即为超规格)

三、 连续五分钟超规格认为一次告警,获取所有用户的所有告警(输出user_id,告警开始时间戳、结束时间戳)

全部评论
佬,最后oc了哪些
点赞 回复 分享
发布于 2023-10-20 00:35 北京

相关推荐

03-30 20:12
已编辑
东南大学 C++
1.你做一下自我介绍。2.你的规划是什么?3.你说的是长期规划,那技术方向上有什么倾向?4.你有考研的计划吗?5.你是打算本科毕业直接工作吗?6.你们现在保研结果出来了吗?7.你现在有没有其他实习 offer?8.字节那边的实习没有继续做了吗?9.你现在不能再回原来的组实习了吗?10.如果原来实习的组给你 offer,你会去吗?11.你做的 C++ 客户端是 PC 端的吗?12.你们做的是一个 C++ SDK,对接 iOS、安卓和鸿蒙,是吗?题目一 / C++ 并发相关15.这段代码有什么问题?16.为什么这里会出现多线程问题?17.除了加锁,还有什么解决方法?18.你先解释一下 static 作用在变量上、作用在函数上有什么区别。19.如果这个函数是类里的普通成员函数,里面定义了一个 static 变量,再对它做 push_back,会有什么问题?20.为什么这个 static 变量不会每次调用都重新初始化?21.如果你用锁来解决,这个锁应该声明在哪里?22.如果这个类实例化出两个对象 A 和 B,它们都会调这个函数,那是不是也会操作同一个数组?23.那这里是不是应该用静态锁,或者类似的全局共享锁?24.除了用锁之外,还有没有别的解决办法?25.你提到原子变量,那你怎么理解原子变量?26.如果代码可以随便改,为什么不能把 static 去掉?27.把 static 去掉以后,能不能解决并发问题?28.如果把 static 去掉,会引入什么额外问题?C++ / 容器 / 数据结构29.你简历里提到用了 concurrent hashmap,可以介绍一下吗?30.哈希表的实现原理你知道吗?31.哈希表是有序的还是无序的?32.如果要把它做成“按插入顺序有序”,你会怎么做?33.标准库里的 std::map 底层实现原理你了解吗?实习项目追问34.你介绍一下你说的这个三档 TTL 和分层缓存框架。35.这个 key 是怎么设计的?36.value 里存的是什么?37.这个缓存是怎么更新的?怎么触发更新?38.这样的话使用方如果拿到的是过期值,是不是要多等一次回源时间?39.你们的缓存命中率大概是多少?40.你拿到这个 key 之后,怎么知道去访问哪一档缓存?41.这个分档是动态判断的,还是你们手动维护配置文件?题目二 / 设计与代码实现操作系统52.你对虚拟内存有什么了解?53.虚拟内存是怎么实现的?54.系统怎么找到被换到磁盘上的那块数据?55.这个地址映射是怎么设计的?56.这个映射关系的数据结构叫什么名字?SQL 优化 / 实习项目57.你之前做过 SQL 优化,是吧?58.解释一下什么是 SQL 签名化。59.这个服务是在后端部署的服务查数据库,还是端上的 SDK 查本地数据库?60.你查端上的数据库时,每次都要建立连接吗?61.你说多个 SQL 合并之后,只查最小时间戳,是什么意思?62.你们做这个优化的前提,是多个请求同时发过来,对吧?63.你们会去缓存这些请求吗?64.这个缓存多久?题目一二详见图片,正常面试一直在追问,然后不给反馈,全程冷脸。当然也认识到很多知识盲区了。很多不重要的问题删了,大多数是问实习。
点赞 评论 收藏
分享
查看13道真题和解析
点赞 评论 收藏
分享
评论
17
128
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务