ssssleep - 个人主页动态

发布(17) 评论刷题收藏

2025-04-10 19:07

已编辑

字节跳动_Tiktok商业化_数据研发(准入职员工)

有没有北京融中心附近租房的🐮u

可以一起合租 也可以以后一起出来玩 有个伴引下流：

牛客租房专区

0 点赞评论收藏

2025-01-29 08:16

字节跳动_Tiktok商业化_数据研发(准入职员工)

面经｜百度-数据开发实习

2024.12.24（一面）一面（30 mins）- 自我介绍- 实习拷打- 字节-链路优化改造- 简单介绍维度建模- JAVA（❌）- 多线程- 异常处理- Linux（❌）- 怎么给文件夹分配读写操作- 查看文件内容- 监听日志- Spark- 宽窄依赖怎么划分- 有几类算子，分别举例- 数据倾斜的定位和常见处理方式- SQL：Top N的变种- 算法：二分查找二面（30 mins）- 自我介绍- 实习拷打

查看13道真题和解析

0 点赞评论收藏

2025-01-29 08:16

已编辑

字节跳动_Tiktok商业化_数据研发(准入职员工)

面经｜快手-数据开发实习

2024.12.23（一面）一面 （1h 5mins）- 实习拷打- 快手-评论模版留存率（10 mins）- 严格漏斗和非严格漏斗的区别- 字节-链路改造优化- 延伸：数据的时效性怎么保证（从整体和单点分别叙述）- 延伸：优化任务的思路- 延伸：并行度相关的改法（三种）- repartition（）能改变第一个stage的shuffle write的并行度吗？- 第一个stage的shuffle write的并行度由什么决定？- 字节怎么分的数据域- 字节分了哪些主题域- 数据域和主题域的区别（主题域：自上向下，从分析的角度划分）- 分层的意义（复用性和一致性）- 怎么考虑分层，该分多少层（直接说了没必要在意这个，要理解分层的本质，面试官表明说的也有道理，也抛了另一个观点：肯定要分层，需要有不同粒度的数据，每个人在意数据都不同，比如说老板在意汇总层的数据，数分可能更在意明细层的数据，另外，在做归因分析的时候也需要血缘追踪）- SQL题二面 （26 mins）全程实习拷打- 自我介绍- 字节实习- 多机房代码一致性怎么保证的（治理存量，增量通过oceanus）- 多机房涉及到的网络问题（通过全球化数据迁移解决）- 快手实习- 评论模版留存率- 严格漏斗和非严格漏斗的区别（准确性和计算量之间的取舍）- 为什么这样设计- 最终的目的是什么- 有没有想过通过抽样解决数据量大的问题- 反问

查看18道真题和解析

0 点赞评论收藏

2024-06-17 20:30

字节跳动_Tiktok商业化_数据研发(准入职员工)

面经|滴滴出行-数据开发实习

1.自我介绍2.两道SQL3.mapreduce中map阶段和reduce阶段的task的数量怎么确定4.了解哪些建模方式，了解维度建模吗，说说他们的区别5.rdd有哪些shuffle类算子6.shuffle的本质是什么7.为什么数仓要分层，分层的意义在哪8.四个排序的区别9.spark的提交流程10.hive中的元数据存储了哪些内容已过

查看8道真题和解析

0 点赞评论收藏

2024-06-13 16:00

字节跳动_Tiktok商业化_数据研发(准入职员工)

有没有uu最近入职深圳字节或者附近公司的 可以一起交流下

0 点赞评论收藏

2024-06-13 15:25

字节跳动_Tiktok商业化_数据研发(准入职员工)

面经|字节跳动-数据开发实习

一面： 1.自我介绍2.数仓分层3.来了新的业务怎么建模4.选用的什么模型，有什么考量5.如果现在一张事实表一对多一个维度表，此维度表又一对多一个维度表，怎么设计模型6.实习过程中用的什么计算引擎7.spark UI会看哪些内容8.数据倾斜问题怎么解决9.介绍一下项目10.为什么有的指标在下沉的时候要拆开来11.SQL调优，讲一个具体的例子12.SQL题：求中位数二面：1.自我介绍2.对数仓的理解，为什么要有数仓3.数仓和传统的数据库区别在哪里4.介绍一下实习公司数仓的分层5.实习拷打6.严格漏斗模型和非严格漏斗模型的区别是什么7.Spark的RDD是什么8.RDD的容错是怎么实现的9.RDD、DataFrame、DataSet三者的差异10.DataFrame会做哪些优化11.什么是闭包（不知道）12.SQL题：直播间最大人数反问：为什么有些公司有DWM层，有些公司没有，有无DWM层对数仓有什么影响。七天后oc + offer

查看23道真题和解析

0 点赞评论收藏

2024-06-06 19:56

已编辑

字节跳动_Tiktok商业化_数据研发(准入职员工)

面经|网易数智-数据开发实习

一面： 面试官设备有问题临时改为电话面1.项目拷打2.指标下沉怎么做的3.数据从业务数据库到数仓，怎么估算数仓需要的存储资源4.了解哪些窗口函数就记得这些了，其他的一会想不起来二面：1.自我介绍2.实习拷打3.spark的内存，OOM，和哪些参数有关4.spark的本地性级别5.如果我现在有10个Executor，每个Executor有2个核，有200个task，但是发现只有两个Executor一直在处理task，并且task处理的非常快，大概就几秒6.有什么参数能解决这个问题吗7.指标下沉怎么做的8.有没有其他下沉的方式，比如说口径下沉hr面：1.自我介绍2.对未来职业选择的设想3.聊数分到底卡不卡学历4.怎么理解数仓开发的价值5.有了解网易的产品吗6.是什么契机去上一段实习7.上一段实习在什么部门，主要的职责是什么8.实习获得的收获9.为什么觉得业务能力很重要10.自我评价一下最强的技术栈11.介绍竞赛12.从竞赛中获得的价值13.为什么这么积极找实习已OC

查看24道真题和解析

0 点赞评论收藏

2024-05-13 13:46

已编辑

字节跳动_Tiktok商业化_数据研发(准入职员工)

面经|蔚来-数据开发实习

一面： 1.拷打项目2.拷打实习3.sql top n面试官应该不是数仓的，应该是偏向平台开发那边，所以没问八股二面（5.13）已OC

查看3道真题和解析

0 点赞评论收藏

2024-05-07 15:05

已编辑

字节跳动_Tiktok商业化_数据研发(准入职员工)

面经|海亮集团-数据开发实习

1.实习经历拷打2.项目拷打3.数仓分层4.sql：连续登录已OC

查看4道真题和解析

0 点赞评论收藏

2024-05-07 15:04

已编辑

字节跳动_Tiktok商业化_数据研发(准入职员工)

面经|AviaGames-数据开发实习

1.自我介绍2.对公司有没有了解3.inner join的底层实现，有哪些算法4.两个数组，数组的大小都在数千万级以上，但是值域是在一千万以内，找到两个数组相同的元素（说了bitmap）换了部门负责人来面试5.有了解过数仓整体的架构吗（面试官说现在是存算分离，实时和离线一体）6.有写过UDF吗，当时的场景是什么样的7.假设现在用的是yarn，pyspark从提交文件到让代码分布到各个节点上的过程（面试官说主要关注driver中的代码和数据怎么和java线程交互）8.为什么从大厂离职当场通过已OC

查看4道真题和解析

0 点赞评论收藏

2024-04-24 19:55

字节跳动_Tiktok商业化_数据研发(准入职员工)

面经|某小厂-数据开发实习

一面（4.24）：总体30 min1.为什么在上一家公司离职2.对公司有什么诉求3.理解到你的诉求是想提升技术了，那假如在公司干活不能提升你的技术那你会怎么办（跑路）4.你希望自己以后成为什么样的人5.AB test6.标准明细表（没太听懂）7.数仓的分层8.spark为什么比MR快9.项目中具体干了什么活10.你觉得沟通很重要吗11.如果你有简单的方案可以完成业务方的需求，但业务方坚持要你用他所提供的更复杂的方案怎么办（把两边的leader拉过来开会）12.如果两边的leader都不想管这件事怎么办（？？？？？？？）13.数据倾斜总体感觉一般，感觉和面试官在很多观点上有diff（面试官认为技术人员是为业务方服务的，要尽可能去完成业务方的需求；我认为技术人员和业务方是平等的，他让我干的活我不想做我可以选择不做面试官认为我在面试过程中提到的需求做不了这种事情不可能存在。你没接触过这么大数据量的数据当然不知道还有跑不动的任务）

查看13道真题和解析

0 点赞评论收藏

2024-04-28 15:46

已编辑

字节跳动_Tiktok商业化_数据研发(准入职员工)

面经|飞未云科-数仓实习

一面（4.24）：1.项目2.遇到重复的数据怎么去重3.row_number()、dense_rank()、rank()三者的区别4.算法5.爬虫相关已OC

查看2道真题和解析

0 点赞评论收藏

2024-03-01 19:41

字节跳动_Tiktok商业化_数据研发(准入职员工)

求救实习被发现了

实习被发现了辅导员让我在休学和回去上课里选一个 🐮u们有什么建议吗

沉淀顶峰相见：硬着头皮也不能回去，我就是当初本科没实习秋招被狠狠拷打才考研的

0 点赞评论收藏

2024-02-08 17:56

字节跳动_Tiktok商业化_数据研发(准入职员工)

年后快手元中心附近合租

有没有🐮u年后一起在元中心附近合租啊

0 点赞评论收藏

2024-01-31 16:04

字节跳动_Tiktok商业化_数据研发(准入职员工)

面经|快手数据研发实习生二面

1.Spark执行流程2.HDFS的读写流程3.HDFS在读流程中最适合的副本是哪个4.对数仓的理解5.数仓分层的作用6.说一个你觉得有挑战性或者复杂性的数据倾斜的例子7.选一个项目拷打反问整体33mins左右

0 点赞评论收藏

创作者周榜

关注他的用户也关注了：