攒人品:作业帮大模型算法面经

作业帮大模型算法面经

  1. 讲一下kv cache是怎么节省空间的?kv cache的计算流程
  2. kv cache有没有改进空间
  3. 参数怎么调整的?有什么意义?top k/top p/温度参数
  4. 一个大的模型,怎么得到一个小模型?
  5. Tokenizer 训练用了什么模型?
  6. 讲一下 Grouped Query Attention
  7. 讲一下 RoPE旋转位置编码
  8. git操作 如何拉取一个分支的代码到本地
  9. 如何讲一个分支的代码提交远端?
  10. 如果批量的对一批文件做移动操作?
  11. 旋转位置编码可以加强长上下文,如果这个时候输入了一个超过最大长度的句子,该怎么处理?
  12. 如何量化评价模型?
全部评论
学到了大模型的面经
点赞 回复 分享
发布于 昨天 23:22 北京

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务