字节校招大数据开发一面 1h

1.挑一个项目介绍
2.了解实习经历
3.针对实习项目,问数据层次怎么分层
4.数据分层的作用
5.针对具体实习项目,说明业务逻辑
6.说明实习项目的“订单量"这个指标从源头到产出的 ETL过程
7.针对实习项目,复盘后最大的难点是什么
8.复盘之后有什么收获
9.你刚才说复盘收获是处理小文件,那么spark怎么处理小文件的?
10.处理小文件有哪些方法,举例子
11.hive冷热分离的方法
12.你刚才提到了组里有做ec存储,你了解ec存储吗
13.暑期实习有什么感受,转正了吗
14.了解spark的semi join吗,他是干嘛的
15.了解spark的AQE,这是什么
16.你刚才讲AQE提到了广播机制,这个在spark中很重要,讲讲广播过程呢
17.了解网络吗?讲讲三次握手和四次握手区别。
18.了解数据结构吗?讲讲0(nlog n)的不稳定排序算法
Q1.求开方:给定排序算法。num=5.79,error=1e-8,求x使得abs(x^2-num)
全部评论
小文件处理有啥方法
点赞 回复 分享
发布于 2025-12-24 14:33 云南

相关推荐

01-28 16:08
郑州大学 Java
我从9月份开始接触力扣,是跟随代码随想录刷一步步刷的,刚开始使用Python把随想录里面的每一道题刷了一遍后,发现Python语言节省了很多代码细节和步骤,后面又改用c++刷题,刷到大概80题以后,在这期间,我一边借助AI帮助我理解语法,debug代码,比如chatgpt,Gemini等,一边刷,差不多把随想录的题型过了一轮,我的感觉是迷迷糊糊的,简单题还是没思路,中等题那就更加了,那时候就开始怀疑自己了,但是还是坚持刷到了120题左右,这个时候终于有一点眉目了。我对于简单题有了自己的想法,虽然写出来还是磕磕碰碰的,但起码肚子有点墨水,中等题勉勉强强有思路,在这刷题过程中,最大的困难就是遗忘,刷了又忘,有时候就连很简单的题型只要你很久没二刷三刷,你可能都会忘记基本语法,忘记思路,有时候我都开始怀疑自己是在背题,而不是真正的理解,我也逐渐意识到了自己或许在算法方面没有任何天赋,纯靠记忆和努力,因为有时候做过好几次的题,重新回来做,又会遗忘。现在我算法已经刷到了160题左右,给我的感觉还是觉得自己依旧非常非常菜,碰到没遇到过的题型无论多简单,都不能自己独立做出来,得依靠AI才有能力写一写,中等题也是得依旧外力,这或许就是像我这样的普通人才会有这种情况吧,每次都怀疑自己。像网上三个月速成算法拿下各种国奖省奖或许是卖课的,又或许是真正的天赋者,但是对于我这种普通人来说,可望而不可及,但今后我依旧会坚持每天做一两道题。最后,我的最大感悟就是算法真的容易遗忘,即使你记得流程,但是有一些细节终究无法记得很牢。
点赞 评论 收藏
分享
评论
2
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务