阿里大模型算法一面 面麻了

面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.Agent的架构设计
2.RAG的检索如何实现
3.预训练数据清洗方法
4.Group Query Attention的作用
5.手撕:实现LRU Cache
6.MoE架构的专家路由是对每个token路由还是对每个序列路由
7.KV Cache的优化方法
全部评论
感觉没问啥东西啊
点赞 回复 分享
发布于 昨天 23:27 北京

相关推荐

评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务