腾讯wxg微信搜索一面-日常实习
1.实习项目介绍
2.手撕InfoNCE损失函数
3.绝对位置编码,RoPE和ALiBi三种位置编码原理
4.手撕Transformer(写一个decoder block)
5.手撕多头自注意力
6.说一下DPO的原理和损失函数
7.DPO和PPO的区别
8.DPO阶段相比SFT阶段数据和模型分布的区别
无leetcode手撕
2.手撕InfoNCE损失函数
3.绝对位置编码,RoPE和ALiBi三种位置编码原理
4.手撕Transformer(写一个decoder block)
5.手撕多头自注意力
6.说一下DPO的原理和损失函数
7.DPO和PPO的区别
8.DPO阶段相比SFT阶段数据和模型分布的区别
无leetcode手撕
全部评论
这是后端?
依旧上来四道手撕
这还是后端吗
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享