腾讯wxg微信搜索一面-日常实习
1.实习项目介绍
2.手撕InfoNCE损失函数
3.绝对位置编码,RoPE和ALiBi三种位置编码原理
4.手撕Transformer(写一个decoder block)
5.手撕多头自注意力
6.说一下DPO的原理和损失函数
7.DPO和PPO的区别
8.DPO阶段相比SFT阶段数据和模型分布的区别
无leetcode手撕
2.手撕InfoNCE损失函数
3.绝对位置编码,RoPE和ALiBi三种位置编码原理
4.手撕Transformer(写一个decoder block)
5.手撕多头自注意力
6.说一下DPO的原理和损失函数
7.DPO和PPO的区别
8.DPO阶段相比SFT阶段数据和模型分布的区别
无leetcode手撕
全部评论
依旧上来四道手撕
这还是后端吗
相关推荐
查看22道真题和解析 点赞 评论 收藏
分享
查看9道真题和解析 点赞 评论 收藏
分享
点赞 评论 收藏
分享