抖音大模型算法校招一面 base北京
1.论文用了哪些 RL 算法? 为什么用 DAPO,论文怎么写的?
2.DAPO 超参数对你的领域影响是什么? 你觉得 Clip higher 为什么起作用
3.还有哪些 RL 算法,GSPO 了解过吗? 为什么你的 ACL 的 Agentic 没有用 GSPO?
4.MLLM 训练有哪些节省内存方法?
5.相比较 CV 的小模型,MLLM 你的部署有哪些 trick? 推理加速有什么方法吗?
6.对个人信息 memory 检索和存储有什么好的 trick 和 idea?
7.agentic 思维链信息过长优化方法? 超出上下文导致遗忘或者幻觉严重你是如何解决的?
8.手撕:最长字符子序列
9.反问:业务内容
2.DAPO 超参数对你的领域影响是什么? 你觉得 Clip higher 为什么起作用
3.还有哪些 RL 算法,GSPO 了解过吗? 为什么你的 ACL 的 Agentic 没有用 GSPO?
4.MLLM 训练有哪些节省内存方法?
5.相比较 CV 的小模型,MLLM 你的部署有哪些 trick? 推理加速有什么方法吗?
6.对个人信息 memory 检索和存储有什么好的 trick 和 idea?
7.agentic 思维链信息过长优化方法? 超出上下文导致遗忘或者幻觉严重你是如何解决的?
8.手撕:最长字符子序列
9.反问:业务内容
全部评论
相关推荐
点赞 评论 收藏
分享
查看9道真题和解析
字节跳动成长空间 1005人发布