快手提前批大数据工程师面经凉经

一面:
1、能讲下你做的项目吗?
2、前端的log怎么来的?
3、ngnix,负载均衡用的是哪个策略?iphash还是最小连接,还是权重?
4、码入Mysql这块怎么做的?你是通过什么往里面写数据的?要监听mysql要开始row模式吗?
5、kafka的isr和osr。ack有几种值?
6、最终会落到ES吗?那ES的索引是怎么建的?数据量有多大?数据量大的时候index怎么办?可以按照时间分区去建索引。
7、HDFS怎么读文件和写文件的?
8、最终MR文件输出的个数取决于什么?
9、ZK的ZAB选举算法。他的一个选举算法。ZK里的节点类型有几种?(临时节点、永久节点用来作什么?)
10、HIVE怎么把SQL转成MR了解吗?能想想吗?语法解析、XX校验、BLOG?
11、窗口函数有哪些?rownumber排序取第一个
12、UDF、UDTF、UDAF区别?
13、HBase的架构。region主要是用来管理最终table的一个存储。Store里面又有什么呢?
14、RowKey的设计原则?为什么不能超过一定的长度?为什么要唯一?rowkey太长会影响Hfile的存储是吧?Hfile里面会有memstore,是占内存里的,太长的话放不了太多数据,减慢检索效率。
hbase是按字典序存储的,所以要利用这个排序的特点。
15、FLume主要用来做什么?Flume用tail吗?比如说我删除了一个文件句柄,然后我touch了一个一模一样的文件,文件name是一样的,还能tail到吗?F和f,F的话如果文件名一样还是可以tail到那个文件的。
16、sparkstreaming的工作机制。spark的工作机制,怎么绘制DAG的?
17、sparkstreaming的双流join的过程,怎么做的?讲一下。
18、代码:斐波那契数列。
19、sql熟吗?点击率那些有了解吗?比如说我有一个页面,A页面曝光次数100次,点进去之后跳到B页面,B页面的refer来源是A页面,来源于A页面的只有50,那A页面的点击率只有50/100。

2面:
过程:35min,面试官一开始就说面试分为四个阶段
第一个阶段:自我介绍,简单扼要的讲下流程,你的亮点、你所特有的别人所没有的。1-2min。考察归纳总结的能力。
第二个阶段:考察实际项目的参与度,遇到问题的思维方式。会选对你成长最有帮助的一个项目,讲出你的成长是什么?遇到问题怎么解决的?你是怎么爬坑的?会问你一些原理。
第三个阶段:写题目。实现能力、编码习惯、书写能力、书写格式。
第四个阶段:最后聊一聊工作和生活上的随便聊。
MR和spark的执行过程。select a.bp , sum(a.a) from a join b on a.bp=b.bp and a.id=b.id;说一下整个执行过程。
写了个sql题目

2面很紧张,表现很不好,面试官也努力让我不要紧张,说紧张对你没有任何好处,但我还是表现太差了。。。。。。。。
#校招##面经##大数据开发工程师##快手#
全部评论
小可爱你好,面试的时候确实容易紧张,跟着面试官的节奏走就好,加油!。最后我想问下小可爱你还记得你二面的sql题目是啥吗,我明天面数开,吸取下经验😀
点赞 回复
分享
发布于 2020-09-21 16:04
兄弟,你一面完等了多久二面的?
点赞 回复
分享
发布于 2020-09-22 20:27
联想
校招火热招聘中
官网直投
兄弟,你做的什么项目啊?我现在没什么项目经历,很苦恼啊。
点赞 回复
分享
发布于 2020-09-24 16:43
问的这么广吗
点赞 回复
分享
发布于 2021-06-02 00:37

相关推荐

#推荐算法面经##快手暑期实习### 快手【转正实习】-推荐算法(简历挂)简历挂快手【转正实习】-机器学习(第二志愿流转)### 第一次面试 - 时间:2024-03-27 11:00- 自我介绍- 手撕:  - 数组中第K大值(维护K大小的堆,复杂度O(nlogk))  - 快速幂- 本科推荐系统项目  - 召回用了哪些    - 非个性化:热度和高质量召回    - 个性化:FM、deepFM  - 召回的输入特征怎么来的  - FM召回算的什么分数,干什么用的  - FM特征怎么构造的  - 年龄等dense特征怎么处理的:直接送入或者分桶  - 召回融合方式:轮转召回融合和线性加权  - 排序用了哪些    - 协同过滤    - deepFM  - 协同过滤怎么做的  - 知道/用过哪些评测指标  - 是用的离线推荐吗:只写了离线层,没有实现在线层和近线层,数据规模小,用户五万 物品十万  - 大规模数据怎么处理:聚类选择代表性物品和用户,聚类id  - 数据库里存的什么信息,怎么计算FM的二阶特征交叉  - 冷启动怎么解决- 论文:照着paper讲解- 反问环节  - 项目规模  - 落地业务  - 我对该岗位来说,还有哪些需要提升和学习的?套评价,分析面试官反馈:实操丰富,但是缺少实践经验,本身招实习也是为了你们能来实战,感受业务场景从评价看,感觉一面能过。中午面下午就来二面消息了,不愧是**快**手,确实快😀
点赞 评论 收藏
转发
1、实习做的什么东西,有什么技术难点,答kafka保证exactly once,成为被拷打的开端2、kafka如何保证的不重不丢,答ack机制+去重,手动提交,rebalance等,分区机制,重新选主3、kafka分区策略,负载不均衡的情况如何解决,答负载均衡算法,追问,如果我就是要写到一个分区呢,一个分区的数据量特别大,有什么影响,答消费的慢,耽误整体的进度,如何解决,不会,随口说了个增加线程池数量,糖完了4、幂等是如何实现的,答在数据库中保存个状态,如果状态已经更新到想要的阶段,就什么都不做5、手撕代码,合并k个升序数组,hot100没刷这道题,写了两种方法,都是最low的,一个是存在arrayList里,还有一个是两两merge,最后还有一种问思路,讲了优先队列,然后开始拷打时间复杂度,每个都问了一遍。。6、手撕代码,非降序整型数组,找出索引值等于元素值的最小索引,二分,然后问为什么二分可以实现,然后问如果是double数组还可以吗,直接糖完了7、tcp的拆包、粘包问题8、udp是否有这个问题9、为什么四次挥手10、乐观锁和悲观锁的实现、场景11、如何自己实现一个ThreadLocal,答两层哈希表,给我糖完了,然后面试官问这两层哈希表的key都是什么,第一层我说是线程id,第二层我一开始说string,然后又想到threadLocal的template,随口说了个class对象12、反问,建议,写代码写的太果断了,有最好的思路再写,不然有点浪费时间13、问业务,数据平台部手爹你带我走吧,外边都是摄像头和摄像头的摄像头4月7日更新,已寄
投递快手等公司10个岗位
点赞 评论 收藏
转发
4 28 评论
分享
牛客网
牛客企业服务