快手大模型应用算法一面 50min

1.面试官先简单介绍团队,然后进行自我介绍;
2.对项目和论文进行了细致询问;
3.为什么多头注意力能提升表达能力?
4.大模型中使用RMSNorm的原因?它和LayerNorm有何差异?
5.LoRA和PromptTuning的区别,以及各自适用的场景?
6.模型微调时是否遇到过过拟合?如何处理的?
7.大模型推理时的加速思路?
8.KV Cache是如何起作用的?为什么对长上下文推理很关键?
算法题手撕:
字符串的全排列。
二叉树序列化与反序列化。
全部评论

相关推荐

2025-12-30 16:42
同济大学 C++
仁狂躁使者:哎呀,不用担心,我当时配环境配了两天,项目捋不清就问问导师能不能用ai,慢慢就清了,会好起来的
投递美团等公司8个岗位
点赞 评论 收藏
分享
评论
3
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务