美团大模型算法 日常实习 一面

欢迎友好讨论,信息共享
1.实习拷打
2.做 grpo 遇到熵崩没有?你是怎么理解的?
3.大模型容易 reward hacking,如何解决?
4.VLLM prefix cache实现过吗?
5.如何理解 dspo 这几个算法的创新?
6.长上下文压缩有哪些方法?
7.MOE 的 expert parallel 如何做的?
8.手撕: transformers encoder
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务