虾皮数据开发面经
一面:
1.实习经历追问,数仓建设流程 ,为什么要设计各个层
2.spark的任务调度流程,spark的数据量级
3.spark的性能优化经验?
4.如何定位任务失败?有哪些原因?分别应该怎么处理
5.对于数据治理的理解,在元数据管理的治理中不同的元数据分别有什么作用?你是怎么使用的?
6.数据倾斜的情况在具体的什么业务中出现,举例,并给出你的优化方案
7.如何去保障数据的质量?数据标准你是如何制定的?
8.为什么源数据存在mongoDB?
9.了解agent么?大致讲一下agent的工作原理,mcp和functioncalls的区别是什么?
10.是否参与过模型的微调?agent的数据具体如何处理?数据增强那一块是怎么做的?
手撕:
拓扑排序,leetcode hot100课程表的变形 medium难度
1.实习经历追问,数仓建设流程 ,为什么要设计各个层
2.spark的任务调度流程,spark的数据量级
3.spark的性能优化经验?
4.如何定位任务失败?有哪些原因?分别应该怎么处理
5.对于数据治理的理解,在元数据管理的治理中不同的元数据分别有什么作用?你是怎么使用的?
6.数据倾斜的情况在具体的什么业务中出现,举例,并给出你的优化方案
7.如何去保障数据的质量?数据标准你是如何制定的?
8.为什么源数据存在mongoDB?
9.了解agent么?大致讲一下agent的工作原理,mcp和functioncalls的区别是什么?
10.是否参与过模型的微调?agent的数据具体如何处理?数据增强那一块是怎么做的?
手撕:
拓扑排序,leetcode hot100课程表的变形 medium难度
全部评论
相关推荐