2024-09-15 13:40 已编辑中山大学算法工程师发布于广东

关注

滴滴大模型面经

本人只做点业务数据sft, 做的更加偏向于粗糙业务，直接被拷打麻了，望佬看到可以给我指点一下

1. 现在有一个非常完备的sft指令集，你只能选择1w条，你如何选择数据来使模型的能力更加提升+完备？
2.我们知道sft的时候尽量不要注入知识给模型，因为只希望sft可以提升模型的指令遵循的能力，注入知识的话，可能会导致后面使用的时候模型容易出现幻觉，那我们怎么确保自己选择的这1w条数据没注入知识给模型呢？
3.7b和13b模型微调同一批数据，学习率哪个大？
4. Pretrain/sft/ppo学习率怎么变换？
5. 学习率和batch大小变化一致吗？
6. 做表征学习的时候，模型坍塌的原因？
7. 为什么做rm的时候，用不同的小模型大模型来采样生成后训练出来的rm会比以前那种方法奏效？这很反直觉，因为按照直觉来说的话，这种方式可能会让rm偏向某个权威的模型
8. 现在有很多种方法，有做完pt直接做rlhf的，也有按班就步的pt-sft-rlhf的，还有直接不做rlhf的，你觉得为什么这些方法都有效，你觉得是什么原因造成的？

#滴滴##秋招##面经# #算法# #八股#

全部评论

推荐最新楼层

河北师范大学附属中学自然语言处理

搞这么细啊。有些答案可以去llama3.1的技术报告参考，其他的等大佬回答

6 回复分享

发布于 2024-09-14 15:37 陕西

牛客344243631号

门头沟学院算法工程师

通常lr缩放倍数为batch size倍数的开方。例如batch size增大4倍，学习率对应扩大2倍即可。

4 回复分享

发布于 2024-09-14 20:40 辽宁

temu一号内tui官

拼多多集团-PDD_算法工程师

对TEMU有想法的戳我哈

1 回复分享

发布于 2024-09-22 15:45 上海

门头沟学院算法工程师

佬这是几面啊，滴滴是连着面吗🙌

1 回复分享

发布于 2024-09-15 01:15 广东

算法工程师

蹲蹲答案

1 回复分享

发布于 2024-09-14 18:14 美国

生产日期是今天

门头沟学院算法工程师

蹲蹲答案

点赞回复分享

发布于 2024-10-03 00:59 安徽

temu一号内tui官

拼多多集团-PDD_算法工程师

我们这大模型搜推方向来试试嘛

点赞回复分享

发布于 2024-09-23 16:04 上海

05-09 23:15

The University of New South Wales 咨询项目管理

29 岁年薪百万之前，我也不是一开始就在大厂

最近在牛客上看到很多同学问：春招没进大厂，是不是人生就完了？作为一个工作了快 10 年的人，我想认真说一句：真的不会。我自己也不是一毕业就进所谓“宇宙大厂”的路线。前几年也待过中厂，也做过很多看起来不那么光鲜的项目。后来一路跳到更大的平台，做到中层管理，收入也慢慢上来了。回头看，我觉得年轻时候最容易误解的一件事是：把第一份工作的起点，当成了人生的终局。但真实职场不是这样的。第一份工作当然重要，但它更像一个起跑点，而不是判决书。很多人一开始进了大厂，后来也可能停滞；也有很多人一开始平台一般，但因为能力、表达、项目经验和持续学习，后面越走越好。我面试过很多候选人，也带过很多年轻人。真正拉开差距的，...

面试___岗的必刷题单

点赞评论收藏

分享

05-09 17:30

已编辑

北京交通大学算法工程师

女生，末2数学本，北京顶2 cs硕，一段中厂大模型实习，电网双职工子弟，vivo是浮动薪资，offer帮选，本人可躺可卷

点赞评论收藏

分享

04-17 17:21

安庆师范大学运营

我的简历真的很烂吗

春招投了超级多，连小公司也没招上，毕业只能回家种地了😭

点赞评论收藏

分享

04-10 11:02

已编辑

字节跳动_飞书_全栈开发(准入职员工)

我来的时候，江水很平静

“无名小卒，还是名扬天下？”我知道很多人都不觉得我能走到今天这一步，当然，也包括我自己。在我的人生里，有两部作品刻下了最深的烙印：《斗破苍穹》与《龙族》。它们总被人拿来对照：一边是萧炎的桀骜轻狂，一边是路明非的怯懦衰颓。有人说，天蚕土豆没见过魂天帝，但江南见过真凯撒。我时常觉得，自己就是那个衰小孩路明非。可路明非可以开挂，我不可以；我也无数次幻想过，能拥有萧炎那般年少轻狂的人生，可我没有他与生俱来的逆天天赋。我只是个平庸的普通人，一个看过《斗破苍穹》却开不了挂的路明非，只能一步一步往上爬。从我下定决心找实习的那一刻起，我就给自己定下了目标：“我一定要为字节跳动卖命.jpg”。萧炎有他的三年之约，我有我的两年半之约（其实是一年半）。2024.11.20，科大讯飞的第一封实习offer落进邮箱，我迈出了这场奔赴的第一步。2025.8.18，放弃百度转正的安稳机会，转身走进前路未卜的不确定里。我很感谢我在百度的mentor，是她从茫茫人海选中了我，给了我大厂实习的机会。即便有段时间我状态差、产出不理想，她依旧愿意认可我、希望我留下转正。2025.11.14，我选择走进字节跳动，以实习生的身份重新出发。2026.3.25 - 3.31，一周速通上海飞书，幸遇赏识我的伯乐，斩获Special Offer。被告知面试通过的那一刻，我的内心无比平静，就像这个offer本就该属于我。不是侥幸，是应得的。这一路，有人看轻过我的出身，不相信我能走到这里；也有人在我看不见前路的时候，替我举过灯。没有他们的鼓励与支撑，就没有今天站在这里的我。我看到了自强不息的激荡，那是一个双非的伟大乐章！我是雨夜迈巴赫，我要开启属于我的新篇章了。

在看牛客的本杰明很勇...：真心祝贺l总我永远的偶像我滴神

春招至今，你收到几个面试...

点赞评论收藏

分享

05-06 13:41

门头沟学院 C++

校招C++20并发系列06-手写自旋锁：理解忙等与互斥的本质差异

深入理解 C++ 并发：自旋锁与互斥锁的性能博弈 在并行计算中，序列化对共享资源的访问是核心挑战之一。虽然 std::mutex（互斥锁）是最常见的同步原语，但在特定场景下，自旋锁（Spinlock）能提供更优的性能表现。本期教程将深入剖析两者的本质差异，并通过基准测试对比其实际性能，最后从底层汇编角度揭示自旋锁的实现原理。 互斥锁与自旋锁的核心差异 互斥锁和自旋锁的主要区别在于等待锁释放时的策略不同。 当线程尝试获取一个已被占用的锁时，有两种基本处理方式： 休眠唤醒机制：线程进入睡眠状态，让出 CPU 时间片，直到锁被释放后由内核唤醒。这是 std::mutex 的典型行为。 忙等待机制：线...

点赞评论收藏

分享

评论

23

95

招聘动态

完美世界

拍了拍你并邀请你投递

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

联想

27届暑期实习

联想

26届补录

27届校招宝典

厦门银行

2026届春季校园招聘

快手

27届实习超多转正机会

联宝科技

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

89200次浏览 639人参与

# 百度工作体验 #

332722次浏览 2255人参与

# 在爱玛，骑向未来 #

45158次浏览 440人参与

# 打工人的精神状态 #

154671次浏览 1554人参与

# 简历当中有水分算不算造假？ #

176576次浏览 2330人参与

# 你收到了哪些公司的笔试？ #

69389次浏览 446人参与

# 你以为的实习VS真实的实习 #

142816次浏览 758人参与

# 备战春招/暑实，现在应该做什么？ #

70347次浏览 557人参与

# 机械人，说说你的烦心事 #

148890次浏览 1165人参与

# 职场新人体验 #

192946次浏览 1241人参与

# 距离春招还有一个月，你现在是什么开局？ #

62886次浏览 320人参与

# 银行笔面经互助 #

198601次浏览 1326人参与

# 工作后，你落下了哪些病根 #

42483次浏览 294人参与

# 应届生，你找到工作了吗 #

174264次浏览 900人参与

# 毕业季，给职场新人一些建议 #

221499次浏览 2603人参与

# 面试被问期望薪资时该如何回答 #

402791次浏览 2219人参与

# 实习生工资多少才算正常？ #

77077次浏览 534人参与

# 你被哪些公司挂了？ #

198494次浏览 1077人参与

# 我们是不是被“优绩主义”绑架了？ #

49579次浏览 550人参与

# 你会为了工作牺牲生活吗？ #

81934次浏览 466人参与

# 实习生的蛐蛐区 #

958896次浏览 4851人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务