美团大模型算法 日常实习 一面
欢迎友好讨论,信息共享
1.实习拷打
2.做 grpo 遇到熵崩没有?你是怎么理解的?
3.大模型容易 reward hacking,如何解决?
4.VLLM prefix cache实现过吗?
5.如何理解 dspo 这几个算法的创新?
6.长上下文压缩有哪些方法?
7.MOE 的 expert parallel 如何做的?
8.手撕: transformers encoder
1.实习拷打
2.做 grpo 遇到熵崩没有?你是怎么理解的?
3.大模型容易 reward hacking,如何解决?
4.VLLM prefix cache实现过吗?
5.如何理解 dspo 这几个算法的创新?
6.长上下文压缩有哪些方法?
7.MOE 的 expert parallel 如何做的?
8.手撕: transformers encoder
全部评论
相关推荐
查看10道真题和解析