【更新至二面】网易严选大数据岗位内推一面面经

【一面】
上来问了一下项目  我项目是写一个基于hive的flink sink
spark和flink对比  为什么spark streaming做不到毫秒级响应
kafka大致的架构   为什么高可用   高吞吐   zero copy原理
hashmap的结构
sql题  两个表 一个是订单表  一个是部门表  找到每个部门哪个用户加起来所有的订单金额最大

【二面】
二面纯项目 连自我介绍都没有  也没有算法题或者sql题
我的项目是基于hive的电商数仓  所以问hive比较多
知道hive的sql语句怎么转成MR可执行任务的吗
MR的shuffle机制了解吗
数据仓库怎么分层 你的项目里分了哪些层
DWS层和ADS层有什么区别
有没有写过hive的UDF   怎么写的
流量漏斗分析  和页面来源分析知道吗
hive什么时候会产生数据倾斜  怎么处理
项目数据来源有哪些  有没有清洗数据  怎么清洗
有没有搭过大数据集群 用到哪些组件  每个组件的作用
计算框架了解吗  flink的checkpoint机制
#网易##面经##内推##秋招##大数据开发工程师#
全部评论
更新二面
点赞 回复 分享
发布于 2019-08-21 16:53
严选今年还会招人么……他们自己内部考拉的人都吃不下吧
点赞 回复 分享
发布于 2019-08-16 11:07
面试完是直接出结果还是等10天?
点赞 回复 分享
发布于 2019-08-16 10:55
在面试之前,你有么有遇到,无法模拟面试的情况
点赞 回复 分享
发布于 2019-08-16 10:53
老哥,你是准时被叫号了吗
点赞 回复 分享
发布于 2019-08-16 10:53

相关推荐

02-25 16:55
已编辑
北京工业大学 Java
211本,找日常实习的话,如果面向中厂的话,需要刷hot100么?因为之前从来没刷过,算法仅限于学校课程水平,准备3月投递简历,现在还需要背八股文,时间有些紧张,还需要刷算法题么?同时什么样的公司可以算是中厂呢?
程序员小白条:中大厂说的上名字的,必定要算法,hot100只是最基础的了,题库远不止100题捏,一般在300-400题量之间,算法=学校课程=简单题也做不出,多准备八股文和算法吧,其他项目可以放放,精刷算法就行了,花时间成长很快的
点赞 评论 收藏
分享
1、自我介绍2、Agent项目是实习项目还是个人项目?有没有上线?3、拷打实习(10min)4、大模型微调,你的训练数据集是如何构建的?数据量有多大?5、在构建数据集的过程中,遇到了哪些挑战?花了多长时间?6、你之前的实习经历偏后端工程,你未来的职业规划更倾向于纯后端开发,还是希望从事与AI/大模型结合的工作?7、详细讲一下Golang中Channel的概念和作用,它是否是并发安全的?8、Channel和传统的锁(Mutex)在实现并发控制时有什么区别?各自的适用场景是什么?9、讲一下GMP模型10、当P的本地队列为空或者不为空时,它会怎么去调度G(协程)?11、Redis支持哪些数据结构12、为什么Redis的速度这么快13、如何实现一个类似淘宝搜索框的实时商品名称模糊搜索功能?14、实时输入联想与输入完成后点击搜索在技术实现上有什么本质区别?15、实时搜索通常使用什么网络协议(如WebSocket)?你了解或有使用过吗?讲一下16、请详细说明微信扫码登录的完整流程和背后发生的原理17、在微服务架构中,服务发现和负载均衡是如何实现的?18、服务注册中心(如Nacos, Consul)是如何工作的?服务实例如何注册和保活(如通过心跳机制)?19、讲一下Agent中的“长短期记忆”20、什么样的信息应该放在长期记忆,什么样的信息放在短期记忆?21、当对话轮数很多,上下文窗口不足时,有哪些处理策略?(如截断、压缩)22、如果要进行记忆压缩,通常有哪些方法?23、了解过Agent的设计范式吗?有哪些?24、你设计的Agent是怎么实现ReAct模式的?详细讲讲25、手撕:实现一个并发任务处理器:给定一个包含100个任务ID的列表,要求控制最大并发数为3,模拟并发调用某个外部接口(如打印ID)26、反问
三本咋了:很好的面筋
查看24道真题和解析
点赞 评论 收藏
分享
评论
1
38
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务