字节-懂车帝-数仓一二三面

最近boss上内推太多了,lz也投了几个,其中字节有反馈,问了问我想做哪方面工作,我说数据方面的吧,然后就给我推到了数据仓库岗位,具体过程如下

3.19一面:

1.自我介绍
这个东西准备一下可以让面试官觉得你对找实习很重视,我的自我介绍模板是,基本信息-学校项目总结(项目大体内容,目的,最终成果)-具体工作内容-用了哪些技术栈学到了什么东西-实习经历-实习内容
2.具体实习内容介绍
这个地方问了好多东西,真的是深挖,可能是学校项目和他们业务没啥关系,一点都没问
3.对hive的理解,hive与mysql的不同之处
4.数据库和数据仓库的区别
5.mysql数据如何同步到hive里面
6.增量提取和全量提取
7.业务库同步到hive是怎么实现的,redis是怎么实现的(没用过redis很惭愧)
8.三道sql题
  • 行转列考察case when语句
  • 每个uid发布的前三篇文章,考察窗口函数,用row_number()解决
  • 两个表求次日留存率
9.left join,right join和full join的区别
10.udf了解吗(不了解-_-)
11.数仓建模分层有了解吗,是否了解维度建模
12.数据库三范式
13.冒泡排序(就这我都能写成选择排序,算法题真的需要啊!!)
大体就问了这些内容吧,字节面试是在牛客上面试的,用的浏览器最好是谷歌浏览器,否则可能打不开,面试界面左半部是牛客的答题环境,右上角是面试官的视频界面,面试官出题你这里会有显示,然后当场作答,你写的每一个字母他都能看到,包括一些编程习惯什么的都是可以看出来的。
面了40分钟左右,过了两个小时hr小姐姐给我打电话说我通过一面了问什么时候可以约二面,然而当时我已经在回老家的火车上了。。后来就是约在了3.22下午两点也就是刚刚进行了二面。

3.22二面

1.自我介绍
2.实习内容介绍
3.hive底层调度
4.left join在mapreduce框架里有什么执行过程
5.shuffer是什么过程,什么情况下会造成shuffer,我们希望有这个过程吗
6.依然是自定义函数,我依然没有用过。。
7.常用的排序窗口函数有哪几个(这个我知道啊啊啊啊!!但是没答出来暴风哭泣)


  • Dense_rank() 重复连续,可能排名情况11234
  • Rank()重复不连续,排名情况11345
  • Row_number()按顺序排12345


8.用没用过spark
9.spark和hive的区别
10.hive跑spark和mapreduce的区别是什么(这里面试官已经在叹气了!!!)
11.数据建模方式
12.建设表的方法论
13.依然是对数据仓库的理解,为什么要对数据仓库进行分层
14.给了我一个业务场景,比如头条的数据为例,一天10t数据,给了我半年的数据,我该怎么去维护这个数据,最后如果上级要一些指标,比如某一天的爆款文章,如何快速高效的提取这个指标
这个我开始不太理解维护的意思,后来面试官会不断换问法来诱导你,这个最后答得就是我先对这些数据进行不同维度不同粒度的聚合,比如每一个点击数据看天计算数量,从文章维度聚合,从用户维度聚合之类的,最后的数据量肯定是越聚合越少的,感觉这个题应该答的是面试官想要的那种,面试官给了正面的反馈
15.一道sql题,给了两个表,有用户id和日期以及level属性,如何在不用join的前提下计算第二天相对第一天level上升的用户数
最后反问环节我有问这个该怎么弄,面试官说用自定义函数,,我前面明明说了我不会自定义函数(-_-)
16.学校工作怎么样,实习时长,
17.反问环节


时长半小时,感觉答得一塌糊涂吧,吭哧吭哧的就是菜,听说一共三次技术面,面完赶紧复盘写个面经攒一波运气,一定要过啊啊啊啊


-------------------3.23---------------------

感谢牛客!欧气十足!!刚刚hr通知我可以三面了哈哈哈,面完更新三面面经

-------------------3.24---------------------

三面结束我又来祈福了,三面谈了30分钟,其中面试官迟到了10分钟,中间是hr小姐姐和我连线(小姐姐真漂亮),所以4:40结束面试。接下来开始吐槽
哇这个面试官根本不按套路出牌啊,我背了半天的自我介绍根本没用上,上来直接问我实习内容,一二面里面各种各样的问题一个都没问,虽然我也不一定会但你不应该考考么!!都不给我展露真诚的机会!项目差不多问了五分钟,然后就开始做题!!
先问我会不会其他业务,会不会写留存,我说我一面写过了,然后就开始出其他题,这个题很明显是面试官现编的呀!!我就看左边那个出题框一直往外蹦字!!啥也不说,上题!
  • 源表detail(device_id,event,time)
每个设备按照时间正序的前三个事件
device_id,event1,event2,event3
原题啊兄弟们!!么得别的信息了,开始没认真审题,觉得和一面的第二道题差不多,就继续用了row_number结合了case when,然后面试官问我你这个每个device_id返回了几行数据,最后他要的其实是一个设备保留一行数据,我也没想到什么好办法,就分了三个子表做了个表连接,应该是满足需求的,但是也不知道面试官满不满意。。对了,我做题过程中面试官把麦关了和隔壁聊天去了(-_-)
第二题是问了我一个场景,就是有两个文件,文件里面是手机号,放不进内存里面,问如何判断两个文件里哪些手机号是相同的。这个问题最大的问题是任何一个文件都放不进内存中,所以我答了把文件拆分他就问我怎么拆分,按什么逻辑拆分,因为放不进内存嘛,那我手动拆行不行!!!哎,我这个算法基础太薄弱了也没接触过这些工作,反正这个到最后也没答出来,最后再问问我每周实习几天就没了!!没有反问环节,就说后续等hr联系吧,行看我吐了这么多大家也能看出来基本是凉了,如果没凉!!那就说明他们真的缺人大家赶紧投啊!!!
虽然表现不好,但是祈求三面通过呀

-------------------3.25---------------------

我三面过了呀!!!晚上七点hr面,感谢牛客!!冲冲冲
再更新一下hr面吧,这次忘记了录音,很多问题想不起来了,想到哪写到哪吧,对了,这次面试的hr就是三面那个连线的漂亮小姐姐
  • 自我介绍
  • 职业规划(读博or工作)
  • 经过前面的面试对自己即将工作的内容有没有了解
  • 如何看待数仓的分层建模,有什么好处
  • 如果因为工作需要你换一种编程语言会换吗
  • 工作学习中遇到的问题,自己是怎么解决的
  • 实习时间
  • 问我什么时候能到岗,我说我现在这边还需要离职审批,暂时给我mark的是4.7,然后说了大小周和薪酬待遇,说后面会有hr加我微信,到现在还没人加我,哇好担心hr面给我挂了
  • 再许愿一波,牛客可太灵了,从一面许愿到hr面哈哈

-------------------4.5---------------------

这篇帖子的最后一次更新,之前商量好入职后,我的内推人随口问了我一句是全日制么,这句话问出来我就明白字节应该是对非全有要求的,果不其然,他说要和hr反馈一下,两天后也就是三月底给了我消息说因为我是非全没办法招聘了,这几天也在忙着投其他公司没来得及更新,虽然很遗憾没有去到字节实习,但是这次面试经历确实还是能够让我学到很多的,hr也说会给我的面试记录写的好一些,写明为什么最后没有要我,并告诉我虽然实习不可以,但是秋招春招是可以按照应届生去招聘的,也算是不幸中的万幸吧,之后各公司开始投递实习简历,通过同学内推在4.2晚上七点面了滴滴自动驾驶部门的数据分析岗,相比字节的面试确实简单了很多,也只有一面,面试官当场表示可以给我实习offer,面试结束后十分钟hr打电话和我约定13号入职,说起来  因为lz是自动驾驶专业,去年11月份面搜狗之前面的就是这个部门,而且是同一个面试官,而且当时也要我了,但是滴滴当时拖了一周才给我答复,导致我第一天刚答应搜狗第二天滴滴就有消息了,没办法只好拒绝了他,没想到啊,时隔五个月,同样的配方,同样的味道,我又回来了,当初狠心拒绝了滴滴,现在哭着喊着要滴滴留下我,哎我说那个命运呐,对了,面试官说部门hc还是挺充足的,但不保证一定得到,无论如何答应了滴滴就意味着放弃了已经到手的搜狗hc,无论好坏都是自己的选择,出来后确实发现非全的就业比想象中还要严峻,不仅是字节,之前加了京东面试官的微信商量面试时也因为非全而取消了面试,目前我所知道的信息中,
对非全实习没要求的公司:
  • 百度
  • 滴滴
  • 华为
  • momenta
  • 旷视
  • 搜狗
  • 美团
对非全实习有要去的公司
  • 腾讯
  • 京东
  • 字节
如有更多的欢迎大家补充
#实习##数据仓库工程师##面经#
全部评论
投的是暑期还是日常呢,非全投日常会有影响么?
点赞 回复 分享
发布于 2021-04-21 19:04
楼主,字节的官方投简历不是要写明非全日制么,既然卡为啥还会捞呢?
点赞 回复 分享
发布于 2021-04-21 16:52
楼主你好,请问你是实习、校招还是社招?
点赞 回复 分享
发布于 2021-04-18 12:44
阿里有了解吗?
点赞 回复 分享
发布于 2021-04-17 12:59
楼主好厉害。请问是放弃搜狗了吗,现在有没有搜狗员工合并方案的消息呀
点赞 回复 分享
发布于 2021-04-14 21:04
感谢楼主分享:那道按设备排序的可以参考下这个。
点赞 回复 分享
发布于 2021-03-25 11:09
好棒,等着你分享面经
点赞 回复 分享
发布于 2021-03-24 14:59
楼主是实习还是春招呀
点赞 回复 分享
发布于 2021-03-24 10:28

相关推荐

3月初面的,当时暑期没开面试官开始先做了部门介绍,以及业务内容,需要实习6个月以上1.R1复现方案,奖励函数为什么这么设置?有考虑过数据泄露的情况吗,就是如果你改的这些题目比较相似的话?有没有出现中英混答的情况?怎么解决?为什么你的最后结果没有突破到更高的分数?你说你用的Kimi K2和Gemini,是什么形式的?API还是网页?如果说不是输出你的奖励词语,也是可以做到推理的,你怎么考虑这个问题?2.手机助手项目拷打:介绍背景,怎么做的。如果我现在的场景是APP更新之后,点击的模块发生变化,你会怎么解决这个问题?如果是上下滑动找商品呢?3.GRPO如果组内设置的size非常小的话会怎么样?4.GRPO的平均是怎么计算的?5.场景题:如果让你来搭建一个LOL的陪玩助手,你会怎么搭建?(这里我没明白这个助手是要当辅助这种还是就一个语音助手就行了,面试官说语音的助手就行了)可以从数据选择,整个架构设计来说。如果用户发现你的这个助手语气太生硬了,你怎样解决?如果版本更新,装备这些东西变了,你是训练到模型里面去的,模型需要重新训练吗?有没有什么解决办法?如果是LOL你在对线的时候,发生了小龙团,你怎么样让助手去做这种场景的一个提醒规划?6.有了解过MOE模型吗?主包只记得激活参数小很多😭7.讲下PPO8.LoRA原理,AB矩阵初始化9.MCP和Skills有了解吗?10.代码:先写打家劫舍,然后改进输出具体打劫了哪些11.多久能到岗?能实习多久?导师那边没问题吗?12.反问:HC?有,需要和暑期同学竞争
查看11道真题和解析
点赞 评论 收藏
分享
04-15 17:41
已编辑
南京林业大学 后端工程师
发面经攒人品两周前一面的,一直没有消息,这周突然二面了一面忘记录音了,只记下来一点三道手撕- 第一题压根没见过,提供了两种指令,要求用这两种指令实现判断字符串是否符合某种性质(不会)- leetcode240搜索二维矩阵 II,hot100题目(还有点记忆)- 给定一堆用户的在线时间记录(格式为[登陆时间,退出时间]),求姐同时在线用户最多的时间段八股环节,他让我选则计网或者系统,我选了计网- http从1开始一直3,每次改进了什么,解决了什么问题- http1.1的头堵塞问题是什么意思- http2为什么会有头部堵塞- http3怎么解决头部堵塞的- 为什么用udp的QUIC协议能将解决头部堵塞- 讲一下https握手- 每次https都要四次握手,代价很大怎么优化?用长连接- 长连接的https万一密钥泄露了怎么办?设定一定的时间,定时重握手二面1. 哪里人,在哪里上学2. 自我介绍3. 讲一下mcp4. 讲一下skill5. 你有一个智能agent项目,讲一下什么叫做智能6. 我想设计一个智能告警系统,有四个项目需要监控,每个项目每天都有致命告警。但是这些致命告警有一些是错报,因为这些告警是别的同学配置的,我没有办法去掉。有两点:一是该系统需要能够同时监控多个项目,二是告警出来后需要去查代码是什么意思或者调用一些工具进行自动化处理。你认为这个系统应该怎么设计?7. 这个系统的rag里面存什么?tool要封装哪些工具?怎么agent按照某个流程执行检查?8. 你简历上的这个项目与刚刚我想要的那种系统很像,你能讲一下两者之间的差异吗9. 你刚刚说到了兜底逻辑需要做一些,能来讲一下大概要做哪些兜底逻辑吗?10. 你平时用什么ai工具,怎么用?11. 用过openclaw吗?12. 讲一下实习项目13. 实习的时候主要是做前端还是后端?14. 怎么实现一个分布式锁,设置超时时间?15. 假设有abc三个在抢锁,简单介绍一下情况。然后a挂了会怎么样,你能从代码级别描述一下吗?16. 你知道MongoDB吗?17. 一分钟快速介绍一下事务的ACID18. 一致性怎么保证?代码中怎么实现?19. 你怎么理解消息队列中的消息持久性20. 讲一下消息队列怎么保证持久性?21. 万一消息队列磁盘坏了怎么办?22. 写操作是只写那个主消息队列吗?23. 了解https算法吗?24. rsa个ec算法有什么区别?不知道25. 你用过哪些对称加密算法?只知道凯撒密码26. 10个业务,一天1亿个计算任务,10万台机器资源,构建一个分布式计算平台。任务大多是cpu型任务,有长又短。你会怎么设计这个平台?27. 你的路由层用多少机器?28. 假设用了三台机器来管理,然后其中要有一个leader,怎么选出一个leader?29. 基于redis实现选举,怎么实现?一开始我说模仿哨兵模式,用一个哨兵节点负责选举。他要求我不用哨兵,就用三台机器和一台redis实现选举30. 现在解决了主master的问题,接着怎么调度?讲一下怎么调度的设计思路31. 假设某一瞬间来了很多请求,你怎么保证所有机器不会被打爆?32. 现在有很多新的技术,你怎么看待新技术,是出来一个就学一个吗?还是怎样一个态度?33. 你怎么学习一个新技术,讲一下思路和方法34. 平时会有多人协作的工作吗?35. 研究生的研究方向是什么?平时干什么?36. 了解编解码算法吗,比如h264和h265,我们这边可能涉及到多媒体数据格式的转化,你了解多少?37. h264中的视频帧分成哪几种?好像是分三种,具体不知道38. h264和265的区别?不知道反问:1. 部门做的是存储、多媒体相关的,我没有这方面背景,对实习生要求是啥?进来后再学,要有自学能力、自驱力2. 转正要求,转正率是多少?50%以上。(存疑,tx转正率有这么高吗)3. 具体业务场景:提供存储服务,用户上传存到这里,访问的时候再下发。面试官追问:1. 你有没有其他offer?
点赞 评论 收藏
分享
评论
20
74
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务