大模型算法岗现在都问这些了吗??

商汤多模态实习面经一面(已OC)
1. 项目+实习经历
2. 阐述一下最熟悉的VL模型
3. 根据2.提的模型进行深挖,包括网络设计,注意力计算的方式等
4. pre-Norm 和 post-Norm 差别
5. attention 计算复杂度
6. flash attention计算复杂度
7. 大模型的训练流程
8. 手撕: torch 手写softmax 并基于softmax的分布写出采样函数
面试官人很好很好!!!!!很轻松,很和谐

#面试问题记录# #机械人面试中的常问题# #算法#
全部评论
招聘算法实习生 - 计算机与数学基础扎实, 熟悉C/C++、Python等编程语言,能熟练操作Linux,Git,熟练使用Pytorch、Tensorflow等框架中的至少一种 - 熟悉Transformer模型框架 - 能实习半年以上 【加分项】 - 了解模型优化加速方案,了解llm模型量化方法(GPTQ, AWQ)等算法原理和实现细节 - 参与过相关开源项目或有会议/期刊论文 - 代码能力优秀,ICPC/NOI或机器学习等比赛获得过奖项
点赞 回复 分享
发布于 08-01 14:13 北京
咋样,二面来了吗
点赞 回复 分享
发布于 08-01 13:43 北京

相关推荐

评论
3
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务