2024-09-15 13:40 已编辑中山大学算法工程师发布于广东

关注

滴滴大模型面经

本人只做点业务数据sft, 做的更加偏向于粗糙业务，直接被拷打麻了，望佬看到可以给我指点一下

1. 现在有一个非常完备的sft指令集，你只能选择1w条，你如何选择数据来使模型的能力更加提升+完备？
2.我们知道sft的时候尽量不要注入知识给模型，因为只希望sft可以提升模型的指令遵循的能力，注入知识的话，可能会导致后面使用的时候模型容易出现幻觉，那我们怎么确保自己选择的这1w条数据没注入知识给模型呢？
3.7b和13b模型微调同一批数据，学习率哪个大？
4. Pretrain/sft/ppo学习率怎么变换？
5. 学习率和batch大小变化一致吗？
6. 做表征学习的时候，模型坍塌的原因？
7. 为什么做rm的时候，用不同的小模型大模型来采样生成后训练出来的rm会比以前那种方法奏效？这很反直觉，因为按照直觉来说的话，这种方式可能会让rm偏向某个权威的模型
8. 现在有很多种方法，有做完pt直接做rlhf的，也有按班就步的pt-sft-rlhf的，还有直接不做rlhf的，你觉得为什么这些方法都有效，你觉得是什么原因造成的？

#滴滴##秋招##面经# #算法# #八股#

全部评论

推荐最新楼层

河北师范大学附属中学自然语言处理

搞这么细啊。有些答案可以去llama3.1的技术报告参考，其他的等大佬回答

6 回复分享

发布于 2024-09-14 15:37 陕西

牛客344243631号

门头沟学院算法工程师

通常lr缩放倍数为batch size倍数的开方。例如batch size增大4倍，学习率对应扩大2倍即可。

4 回复分享

发布于 2024-09-14 20:40 辽宁

temu一号内tui官

拼多多集团-PDD_算法工程师

对TEMU有想法的戳我哈

1 回复分享

发布于 2024-09-22 15:45 上海

门头沟学院算法工程师

佬这是几面啊，滴滴是连着面吗🙌

1 回复分享

发布于 2024-09-15 01:15 广东

算法工程师

蹲蹲答案

1 回复分享

发布于 2024-09-14 18:14 美国

生产日期是今天

门头沟学院算法工程师

蹲蹲答案

点赞回复分享

发布于 2024-10-03 00:59 安徽

temu一号内tui官

拼多多集团-PDD_算法工程师

我们这大模型搜推方向来试试嘛

点赞回复分享

发布于 2024-09-23 16:04 上海

05-08 22:27

已编辑

合肥经济学院运维工程师

25学院本还有救吗

工厂裁员，才干几天，就被辞了，工作是运维助理工程师，在苏州这边，我真不知道找什么岗位了。

点赞评论收藏

分享

05-07 09:20

武汉大学 C++

面试凉经，又凉了好没意思啊

海康威视嵌入式面经随记起初兴致勃勃地投了海康，没想到还是挂在了二面，感觉整体难度还好但是自己当时没想起来。复盘了一下，很多考点其实是有规律可循的。💡 备考建议：如果你也在准备嵌入式方向，推荐先系统过一遍这份面经 我也是看完之后才意识到自己哪里没准备到位的。一面（50min）Linux 中断流程，谈谈你对中断上下文的理解C 语言字节对齐的规则，为什么要字节对齐？进程间通信的方式，为什么分用户空间和内核空间？C++ 多态怎么理解？C++ 有哪些多态的典型例子？C 语言程序运行时的内存分配const 关键字的用法extern C 有什么用？为什么声明 C 语言环境？与 C++ 环境区别？delet...

查看26道真题和解析

点赞评论收藏

分享

05-07 00:11

已编辑

东南大学 Java

日常实习简历求建议

大三想找一份实习做做，请问前辈们这样写简历有什么问题吗，苍穹➕点评会不会太过时了，而且目前也没想好投后端还是agent方面，因为本科是人工智能的，而且目前形势好像也偏向ai一些，求求前辈们指点指点

点赞评论收藏

分享

昨天 15:34

中国农业大学算法工程师

拼多多多模态算法一面面经记录攒人品

发面经攒人品

点赞评论收藏

分享

评论

23

95

招聘动态

完美世界

拍了拍你并邀请你投递

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

联想

27届暑期实习

联想

26届补录

27届校招宝典

厦门银行

2026届春季校园招聘

快手

27届实习超多转正机会

联宝科技

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI让海力士市值突破9000亿美元 #

119次浏览 7人参与

# 百度工作体验 #

334613次浏览 2276人参与

# 在爱玛，骑向未来 #

45801次浏览 440人参与

# 打工人的精神状态 #

154892次浏览 1561人参与

# 职场新人体验 #

193126次浏览 1250人参与

# 工作后，你落下了哪些病根 #

42576次浏览 300人参与

# 百度求职进展汇总 #

730566次浏览 6445人参与

# 机械人，说说你的烦心事 #

149078次浏览 1173人参与

# 简历当中有水分算不算造假？ #

176697次浏览 2330人参与

# 机械人，你最希望上岸的公司是？ #

218231次浏览 1946人参与

# 你收到了哪些公司的笔试？ #

69487次浏览 446人参与

# 毕业季，给职场新人一些建议 #

221679次浏览 2608人参与

# 工作压力大，你会干什么？ #

82828次浏览 713人参与

# 机械/制造每日一题 #

97996次浏览 1501人参与

# 如果秋招能重来，我会____ #

105619次浏览 514人参与

# 你以为的实习VS真实的实习 #

142948次浏览 758人参与

# 米哈游求职进展汇总 #

691506次浏览 3362人参与

# 招聘要求与实际实习内容不符怎么办 #

222908次浏览 1063人参与

# 重来一次，我还会选择这个专业吗 #

467474次浏览 3987人参与

# 稳定和高薪机械人更看重哪个？ #

594255次浏览 5583人参与

# 我想象的实习vs现实的实习 #

338692次浏览 2308人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务