字节大模型llm实习算法一面

发一下问题给大家参考,攒攒人品!
1.实习拷打
2.项目拷打
3你能详细的说一下他们在数据构建流程上的区别吗
4.RL  阶段的数据筛选你具体是怎么做的
5.比如说这个图文对的话,就是它的标签是怎么来的呢
6.在训练这个模型中存在哪些问题你遇到哪些问题,是怎么去解决的
7.就是你刚才说的那个把那些序列拼接成8192的长度,是不是就是Sequence Packing 的做法
8.那你们在处理 VLM 视觉特征时的具体 Packing 细节是怎么样的?因为视觉 Tokens 的处理逻辑肯定比纯文本要更复杂一些
9.怎么去评估,他那个推理过程是否正确呢
10.介绍一下GSPO 在处理这种多维奖励时的具体收敛策略是什么样的
11.你说的这个结果奖励打分模型。大概是用的啥模型?它准确率大概是多少
12.比如说你这个 Thinking 和No-thinking的数据就是它的比例是三比一,你是基于什么得出来的
13.说一下GSPO和GRPO的区别
14.为什么你在在xx公司选 GSPO,在xx公司实习的时候选 GRPO
15.Self-Attention中Q/K/V各自作用?为什么要分开?
16.把K换成Q(QQV)可行吗?为什么?
15.手撕:按指定概率采样(如[(1,0.5),(2,0.1),(3,0.4)])
全部评论

相关推荐

评论
点赞
2
分享

创作者周榜

更多
正在热议
更多
# 春招至今,你的战绩如何? #
11086次浏览 95人参与
# 你的实习产出是真实的还是包装的? #
1960次浏览 42人参与
# MiniMax求职进展汇总 #
24119次浏览 309人参与
# 军工所铁饭碗 vs 互联网高薪资,你会选谁 #
7643次浏览 43人参与
# 简历第一个项目做什么 #
31746次浏览 341人参与
# 重来一次,我还会选择这个专业吗 #
433549次浏览 3926人参与
# 米连集团26产品管培生项目 #
6038次浏览 216人参与
# 当下环境,你会继续卷互联网,还是看其他行业机会 #
187211次浏览 1122人参与
# 牛客AI文生图 #
21446次浏览 238人参与
# 不考虑薪资和职业,你最想做什么工作呢? #
152452次浏览 888人参与
# 研究所笔面经互助 #
118967次浏览 577人参与
# 简历中的项目经历要怎么写? #
310365次浏览 4219人参与
# AI时代,哪些岗位最容易被淘汰 #
63831次浏览 828人参与
# 面试紧张时你会有什么表现? #
30513次浏览 188人参与
# 你今年的平均薪资是多少? #
213144次浏览 1039人参与
# 你怎么看待AI面试 #
180143次浏览 1258人参与
# 高学历就一定能找到好工作吗? #
64331次浏览 620人参与
# 你最满意的offer薪资是哪家公司? #
76546次浏览 374人参与
# 我的求职精神状态 #
448135次浏览 3129人参与
# 正在春招的你,也参与了去年秋招吗? #
363518次浏览 2638人参与
# 腾讯音乐求职进展汇总 #
160677次浏览 1112人参与
# 校招笔试 #
471199次浏览 2964人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务