pdd算法面经

1. 先做个自我介绍吧,可以结合你之前的工作经历聊聊。

2. 你对 SFT(监督微调)中的 scaling law 有了解吗?在实际训练中,你遇到过哪些比较大的困难?

3. 在模型训练时,如果发现 advantage 或者 loss 突然变成 0,一般可能是什么原因导致的?

4. 在构建 AI Agent 时,它的记忆(Memory)机制通常是怎么设计的?

5. 当模型出现 bad case 时,你一般会怎么分析?后续会采取哪些措施来改进?

6. 如果需要为特定领域的文本训练一套 Embedding,你会怎么做?

7. 聊聊你实习时团队的组成和分工吧,大家是怎么协作的?

8. 你对大模型分布式训练的底层了解多少?比如数据并行(DP)、张量并行(TP)这些,看过 Megatron 这类框架的源码吗?

9. 核心代码模式算法题:二维数组中的查找

全部评论

相关推荐

评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务