大模型算法实习一面-拼多多
发一下问题给大家参考,攒攒人品!
1.Pretrain 和 SFT 分别解决什么问题?
2.Transformer 的基本结构怎么理解?
3.多模态模型的大致结构是什么?最容易踩坑的点通常在哪里?
4.SFT 数据如何更贴近业务:如何避免过度模板化?如何做基础的 train / test 去重来避免评测失真?
5.对齐( RLHF / DPO 等)整体思路是什么:为什么需要偏好对/奖励信号?
6.玩过 Openclaw 吗?了解其的记忆机制吗?
7.如果检索返回了很多相关的内容,如何选择最相关的?
8.了解 embeding 吗?
9.了解过 spec-drivening 的 code agent 吗?
10.了解上下文压缩机制吗?
11.为什么压缩前 70%?最开始的几轮对话明确需求不是很重要吗?
1.Pretrain 和 SFT 分别解决什么问题?
2.Transformer 的基本结构怎么理解?
3.多模态模型的大致结构是什么?最容易踩坑的点通常在哪里?
4.SFT 数据如何更贴近业务:如何避免过度模板化?如何做基础的 train / test 去重来避免评测失真?
5.对齐( RLHF / DPO 等)整体思路是什么:为什么需要偏好对/奖励信号?
6.玩过 Openclaw 吗?了解其的记忆机制吗?
7.如果检索返回了很多相关的内容,如何选择最相关的?
8.了解 embeding 吗?
9.了解过 spec-drivening 的 code agent 吗?
10.了解上下文压缩机制吗?
11.为什么压缩前 70%?最开始的几轮对话明确需求不是很重要吗?
全部评论
有没有编程题

可以的,看着有戏呢
相关推荐
查看15道真题和解析 点赞 评论 收藏
分享