05-02 14:35 门头沟学院算法工程师

关注

字节暑期大模型算法实习一面分享

发一下问题给大家参考，攒攒人品！
1.介绍一下实习的工作
2.长CoT数据怎么构造的？
3.SFT和RL的本质区别是什么
4.手撕交叉熵损失和softmax
5.怎么平衡SFT和RL
6.PPO和GRPO的区别，接着问KL散度的位置为什么不一样？实现方式为什么不一样？K3-KL有什么优势？
7.交叉熵和KL散度的区别
8.PPO和GRPO分别适用于什么场景
9.DAPO为什么没有KL散度
10.怎么判断后训练效果不好是缺乏领域知识还是推理能力不足
11.实习的后训练过程中遇到了什么问题，怎么解决
12.手撕：字符串分词的最大分数

全部评论

推荐最新楼层

04-29 19:14

沈阳工业大学测试开发

你这模型自己部署的吗

面试问智能体项目，面试官问背后的大模型是本地还是线上，我回答本地跑不动，就用了线上，还问我线上用哪一家，（阿里云）最后还问了如果要把智能体部署到服务器上，并用自己特调的模型，服务器4核4G，该怎么操作。答利用平台（又是阿里云）部署自己的模型，肯定不会在买的服务器上部署，带不动。

查看3道真题和解析

点赞评论收藏

分享

04-20 02:45

门头沟学院算法工程师

27日常实习字节头条推荐算法一面

继续来分享下最近的面经~1.手撕编辑距离2.dpo grpo基本原理 损失函数构成3.reward hacking解决办法4.kl散度5.llm做数据清洗6.QA注入知识的作用7.grpo在cot场景下不稳定怎么改进8.grpo改进9.dapo gspo聊一聊10.transformer模型自注意力机制计算复杂度

查看10道真题和解析

点赞评论收藏

分享

04-19 06:44

山东协和学院客户端开发

大厂的日常实习会看学历吗？

学院本现在在一家小厂做上位机开发，都说这个方向钱少事多。想转其他方向。如果想投一些大厂中厂的日常实习，他们会筛学院本吗？有没有推荐的公司

点赞评论收藏

分享

04-24 14:23

门头沟学院营销

高通日常实习面试

想问问各位大佬高通的日常实习面试完都久hr会发邮箱下offer

我的求职进度条

点赞评论收藏

分享

04-19 20:45

上海大学人工智能

agent日常实习简历求拷打

很烂的简历

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

20109次浏览 172人参与

# 上班苦还是上学苦呢？ #

345096次浏览 2069人参与

# 在爱玛，骑向未来 #

1507次浏览 161人参与

# 如果春招能重来，我会___ #

21158次浏览 222人参与

# 实习怎么做才有更好的产出 #

49878次浏览 456人参与

# 除了线上，还能去哪些地方投简历 #

11352次浏览 115人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

47616次浏览 515人参与

# AI coding的好用工具分享 #

88406次浏览 567人参与

# 找工作以来，你最看不惯__ #

79377次浏览 594人参与

# 大学四年该怎么过，才不算浪费时间？ #

23828次浏览 106人参与

# 字节开奖 #

150254次浏览 679人参与

# 薪资爆料 #

422187次浏览 2226人参与

# 你觉得实习能学到东西吗 #

154091次浏览 1494人参与

# 你被哪些公司挂了？ #

193206次浏览 1044人参与

# 双非应该如何逆袭？ #

585713次浏览 6388人参与

# 毕业后不工作的日子里我在做什么 #

269049次浏览 1739人参与

# 一份好的简历长什么样？ #

41868次浏览 505人参与

# 硬件人秋招的第一个offer #

129073次浏览 1472人参与

# 双非本科求职如何逆袭 #

1647778次浏览 13075人参与

# 刚工作的你，踩过哪些坑？ #

46655次浏览 296人参与

# 面试线索爆料 #

130921次浏览 704人参与

# AI“智障”时刻 #

40338次浏览 193人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务