字节实习 推荐算法一面 凉经
继续来分享下之前的面经~欢迎友好讨论,信息共享
1、项目拷打,问的比较细致。
2、八股:
(1)XGBoost、LightGBM
(2)Lora
(3)Flash attention和vllm
(4)Transformer(包括分词、位置编码、ROPE处理长序列)
(5)对比学习的温度对于embedding有怎样的影响
(6)好像还有一个问deepseek的MAA的,我直说不了解了。
3、手撕多头注意力
1、项目拷打,问的比较细致。
2、八股:
(1)XGBoost、LightGBM
(2)Lora
(3)Flash attention和vllm
(4)Transformer(包括分词、位置编码、ROPE处理长序列)
(5)对比学习的温度对于embedding有怎样的影响
(6)好像还有一个问deepseek的MAA的,我直说不了解了。
3、手撕多头注意力
全部评论
相关推荐
牛客76783384...:你应该说:*****被猴耍了
查看2道真题和解析 点赞 评论 收藏
分享