蚂蚁借贷部门数据研发一面0915

意外的,没有手撕代码环节。总共40分钟过程比较轻松。

(30分钟)

1.自我介绍

2.针对实习项目a(订单类型的新项目)进行提问:业务逻辑是什么?

3.项目a的dwd层主要干了啥?

4.项目a的数据主体域是什么?

5.为什么这么设计项目a的数据模型?

6.如果发生数据倾斜,订单表在哪发生的?

7.大表join的时候怎么处理数据倾斜?

8.hive分区和分桶的区别?

9.OLAP引擎和OLGP引擎?

10.如果有多个看板,如何保证多个看板的结果一致?

11.如果DWS层有个新维度是基于老维度的,需要进行修改,该怎么修改同时不影响别的表?

12.接11,三个老维度和一个新维度(由三个老维度组成)在dws上的区别?

13.实习项目b中复杂的spark函数是哪些?

14.实习项目b为什么用这些spark函数?

15.数据质量方面在公司用什么保障数据质量?

16.复盘在实习中遇到的数据产出延迟问题。

17.你自评协调合作能力强,在实习中能具体讲讲吗?

后面有点唠家常了,10分钟

18.怎么本科学网络安全,现在学计算机技术,但是投的是数据开发?

19.实习中组里氛围怎样?

20.你是哪里人?

反问:

业务细分、部门情况、工作作息、未来发展方向、面试几轮、对校招生的预期。

全部评论
一般捞家常,就是在考察其他方面了,我每次面试也会问,有些人我就是在这个环节给刷下去的,人家的职业规划啥的,和我这边不匹配的
点赞 回复 分享
发布于 09-19 19:03 陕西
约二面了吗 佬
点赞 回复 分享
发布于 09-25 02:01 湖北

相关推荐

09-23 21:27
已编辑
四平职业大学 机器学习
面试有史以来第一次是本校学长/学姐面,但是很可惜可能G了首先自我介绍,介绍两段实习+硕士课题,先简单介绍了一下,然后让我重点详细介绍一下在蚂蚁的实习工作,就按照timeline列举了一下做了哪些工作,中间穿插一些提问然后又让我重点介绍了自己的硕士课题,聊完课题之后提问:问:是否了解内存池,如果让你设计一个动态内存池,你会有哪些考量?答:先说明自己没有做过上层的内存管理,然后从底层的内存管理介绍了一下,对数据分块、淘汰策略、数据预取等方面的一些基础的策略,然后面试官也没有追问拷打(感谢心软学姐);问:对未来的职业方向有没有自己的想法?答:说了一下自己硕士的方向与现在大模型优化技术的结合,未来可能是一个潜在的优化点,举了一个详细的例子;手撕:实现一个包含环检测功能的链表反转的代码,如果有环,返回nullptr,如果无环返回反转后的head node,腾讯手撕依旧考察基础,让我写完整并且打印示例,一次通过了反问:了解一下业务?答:主要做大数据,介绍了一些业务场景,然后心凉半截,因为我说的未来规划和业务场景基本上毫无关系然后又提问是否了解Ray?我没有听过,我说不了解,然后又问了一句,对其他分布式工具是否有所了解,然后就说了Megtron了解一些后续下来问室友发现Ray就是vLLM官方实现分布式的一个工具,但是之前也没有了解过
发面经攒人品
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务