字节秋招后端三面记录
自我介绍
问硕士项目
transformer网络架构
decoder中qkv分别是什么,与encoder的区别
gpt的训练过程,预训练的loss是什么,数据长什么样,微调loss,数据,强化学习loss,数据(被拷打成2b了)
强化学习算法有哪些
ppo训练中有几个模型,reward模型和critic模型的作用,四个模型中哪个最重要
上下文工程和提示词工程和rag和mcp的关系
rag怎么实现的,向量的索引有哪些方法构建的
做过agent吗
kafka partition和consumer group的底层实现原理
怎么实现不丢不重
消费者如果一个消息正在处理,机器突然重启了会怎么样。如果处理了一半,一些状态已经被改变了,怎么处理。幂等如何实现
算法题 lc440 字典序第k小数字
————————————
更新
hr面结束后一直泡池子,hr态度非常不明朗,看起来池子够大,哥们也够菜,不抱希望了
#26秋招 #后端 #面经 #三面