腾讯wxg微信搜索一面-日常实习

1.实习项目介绍
2.手撕InfoNCE损失函数
3.绝对位置编码,RoPE和ALiBi三种位置编码原理
4.手撕Transformer(写一个decoder block)
5.手撕多头自注意力
6.说一下DPO的原理和损失函数
7.DPO和PPO的区别
8.DPO阶段相比SFT阶段数据和模型分布的区别
无leetcode手撕
全部评论
依旧上来四道手撕
点赞 回复 分享
发布于 昨天 10:47 浙江
这还是后端吗
点赞 回复 分享
发布于 12-01 17:13 北京

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务