腾讯wxg微信搜索一面-日常实习
1.实习项目介绍
2.手撕InfoNCE损失函数
3.绝对位置编码,RoPE和ALiBi三种位置编码原理
4.手撕Transformer(写一个decoder block)
5.手撕多头自注意力
6.说一下DPO的原理和损失函数
7.DPO和PPO的区别
8.DPO阶段相比SFT阶段数据和模型分布的区别
无leetcode手撕
2.手撕InfoNCE损失函数
3.绝对位置编码,RoPE和ALiBi三种位置编码原理
4.手撕Transformer(写一个decoder block)
5.手撕多头自注意力
6.说一下DPO的原理和损失函数
7.DPO和PPO的区别
8.DPO阶段相比SFT阶段数据和模型分布的区别
无leetcode手撕
全部评论
这还是后端吗
相关推荐
11-29 18:38
河北东方学院 前端工程师 点赞 评论 收藏
分享
想进开水团喝开水:杭电也是双非是吧
点赞 评论 收藏
分享
