拼多多算法面经
一面:
1. 自我介绍
2. 聊了之前实习的大模型反欺诈项目,问了从开发、测试到部署的整个流程。(中间穿插拷打了技术栈:MySQL 的主键和索引怎么设的?为啥这么设?底层数据结构是啥?用了哪个 Agent 框架?Prompt 怎么调的?)
3. 介绍了简历上的 LLM Agent 量化因子挖掘项目,顺便聊了聊投资心得,没怎么拷打。
4. 又聊了上个实习做的半监督学习给流量打标签的项目,穿插问了 XGBoost、怎么缓解过拟合、KS/AUC 这些八股,还让我手写了带正则项的交叉熵损失函数。
5. 做题:一道 LeetCode 的“无重复字符的最长子串”,一道 SQL (类似最大连续登录天数)。
二面:
1. 自我介绍,面试官说是做业务风控的。
2. 还是聊那个反欺诈项目,但这次更偏业务,讨论了之前做法的一些不足,让我现场想改进方案。
3. 给了个他们实际的业务场景(用户恶意退款),还有一张用户交易记录表,让我构造特征来预测这种风险。然后问了怎么判断特征有没有效(IV、PSI 之类的)。
4. 聊了之前实习的因果推断项目,问了 A/B test 相关的东西(DAG 图、分层抽样为啥能减小方差的数学原理)、DML 的原理(问到 ATE 估计量怎么才算 Neyman 正交,以及背后的直觉是啥,聊到这面试官说他也是数学系的)。
5. 优化相关:牛顿法、拟牛顿法、XGBoost 里用的是哪种优化?(二阶泰勒展开,本质是牛顿法)
6. 做题:LeetCode 的“三数之和”。
三面:
1. 自我介绍,面试官说是负责 Temu 搜广推的。
2. 问了为啥转码,以及转码过程。
3. 聊了聊聊神经网络八股(主要是 Transformer)。
4. 问了量化实习里 C++ 的使用情况,比如智能指针。还聊了量化投资的大概流程,他说他也感兴趣。
四面:
主要就是聊聊性格、成绩、家庭、职业规划这些。