26届校招|快手大模型应用算法面经
▶️一面
🚤时长约50min
1.自我介绍。
2.拷打了一下项目和论文。
3.为什么多头注意力能提升表达能力?
4.为什么要在大模型中使用 RMSNorm ?和 LayerNorm 有什么差异?
5.KV Cache 是怎么起作用的?为什么对长上下文推理很关键?
6.大模型推理时的加速思路?
7.模型微调时遇到过过拟合吗?怎么处理的?
8.✨算法题手撕:
1️⃣字符串的全排列
2️⃣二叉树序列化与反序列化
▶️二面
🚤时长约40min
1.自我介绍,深挖简历。
2.深挖项目,针对项目思路不断追问。
3.大模型生成内容如何做去重过滤?
4.如果词表特别大(10w+ token ), Softmax 加速通常有哪些实现?
5.如果要在中文领域做Instruction Tuning ,需要注意哪些数据问题?
6.LoRA 和 Prompt Tuning 有何区别,分别适于什么场景?
7.反问。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
#算法岗面试# #推荐算法# #我的秋招日记#
🚤时长约50min
1.自我介绍。
2.拷打了一下项目和论文。
3.为什么多头注意力能提升表达能力?
4.为什么要在大模型中使用 RMSNorm ?和 LayerNorm 有什么差异?
5.KV Cache 是怎么起作用的?为什么对长上下文推理很关键?
6.大模型推理时的加速思路?
7.模型微调时遇到过过拟合吗?怎么处理的?
8.✨算法题手撕:
1️⃣字符串的全排列
2️⃣二叉树序列化与反序列化
▶️二面
🚤时长约40min
1.自我介绍,深挖简历。
2.深挖项目,针对项目思路不断追问。
3.大模型生成内容如何做去重过滤?
4.如果词表特别大(10w+ token ), Softmax 加速通常有哪些实现?
5.如果要在中文领域做Instruction Tuning ,需要注意哪些数据问题?
6.LoRA 和 Prompt Tuning 有何区别,分别适于什么场景?
7.反问。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
#算法岗面试# #推荐算法# #我的秋招日记#
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
活泼的代码渣渣在泡池...:同学你好,我也是学院本,后天要面这个亚信科技,是实习,请问问题都啥样呀,我项目就做了网上的,这是第一次面试

点赞 评论 收藏
分享
10-15 10:23
门头沟学院 Java
牛可乐的头像真牛:赶紧举报,这公司绝对是诈骗的,等你签约后工作一两个月后根据合同漏洞把你开除,并且要求你赔偿3w培训费,996是为了提前筛选心甘情愿签下合同容易受骗的群体,纯粹面向校招生精心设计的骗局 点赞 评论 收藏
分享
点赞 评论 收藏
分享