26校招小红书大模型算法二面

1.八股:大模型框架了解哪些,介绍下vllm原理
2.八股:常用的LLM,讲解DeepSeek R1的训练流程和基本原理。
3.八股:讲讲MOE架构和Dense架构差异,在训练和推理方面
4.项目:介绍实习项目,项目中有没有做微调?
5.项目:DPO,PPO和GRPO的区别
6.项目:为什么PPO要用value baseline和GAE?它们如何让训练更稳定?
7.项目:为什么GRPO在训练MOE时会出问题?原因是啥,怎么改进策略
8.项目:GRPO的KL散度是什么?KL散度中超参数如何设计?
9.项目:阐述大模型的幻觉现象及抑制方法。
10.代码题:lc300 最长递增子序列
全部评论
好难啊
点赞 回复 分享
发布于 2025-12-18 21:16 湖北
看来背八股还是有必要的
点赞 回复 分享
发布于 2025-12-17 20:27 陕西

相关推荐

04-08 20:41
门头沟学院 Java
1.自我介绍2.rag流程讲下3.基于什么框架搭建的4.ppt智能体怎么做的,是只是部署了吗;做了那部分流式,提示词约束,前后端联调5.分块策略讲下,为啥切分还要设置 固定字符6.为撒选择768维度7.讲下embeindg模型原理,transfomer原理;讲下decoder encoder面:本质上decoder就是一个embedding8 milvus原理BM25算法9.讲下欧式距离 内积 向量i相似度底层怎么计算的讲了内积,分解维度向量,点乘相加10.skill讲下渐进式纰漏,为撒大模型可以决定使用哪个答得意图识别,工具排名,然后选择上面的skill调用11.假设sse输出,前端突然关掉页面,后者服务宕机;并且传输的分片,需要长时间等待(LLM或者文生图这样的模型)(现在一起上传前端)提示网络层去做答得:中间件存储面:可以在网络层加心跳机制12.选择一个你擅长的点openclaw claude13claude的skill有哪些;14.你觉得claude有哪些可以拓展的点答得记忆和skill,和项目风格和上下文对齐15.function call mcp skill 调用有什么区别16.openclaw除了定时和skill还用过其他的功能吗17.用aicodeing多吗,用的什么模型;讲下aicoding思路,知道热更新机制的模块吗;glm5,中转节点先架构,python,必须简单运行,先写总体文档,列出要考虑生成环境的点9.2终端再分模块开发限制9-13min18.生产环境考虑的点kafka的一套,有序,幂等,消息丢失;并发;内存存储,服务宕机重启,数据丢失19.为啥要再生成一份项目交付md把需求md覆盖了,生成了个总结的文档主要拷打了底层微调也有问,和transfomer架构kqv和中间额层,和具体用哪个通用大模型的关系
查看27道真题和解析
点赞 评论 收藏
分享
评论
2
11
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务