百度NLP大模型算法日常实习一面
1️⃣实习介绍
2️⃣代码题
求一个整数的平方根,精度0.01
场景题:根据会话 id 和轮次 id,生成 history
3️⃣拷打项目
1.dpo 数据怎么建的,数据的格式
2.dpo 损失函数介绍,为什么用减法
3.β的作用,项目中你设的多大
4.lora rank 设的多大 alpha 有什么作用
5.项目中遇到最困难的事
6.大模型精度不高怎么提升
2️⃣代码题
求一个整数的平方根,精度0.01
场景题:根据会话 id 和轮次 id,生成 history
3️⃣拷打项目
1.dpo 数据怎么建的,数据的格式
2.dpo 损失函数介绍,为什么用减法
3.β的作用,项目中你设的多大
4.lora rank 设的多大 alpha 有什么作用
5.项目中遇到最困难的事
6.大模型精度不高怎么提升
全部评论
dpo 损失函数介绍,为什么用减法,这是为啥啊
相关推荐
03-10 20:11
防灾科技学院 嵌入式软件开发
太阳战士:实在不行先找嵌入式测试,干两个月积累一下丰富一下简历然后找开发,记得包装成开发
暑期实习就别看太重了,多找找日常 点赞 评论 收藏
分享
查看18道真题和解析