小鹏汽车日常实习大模型面经

一面
1.介绍项目,问项目难点在哪,怎么解决的
2.问项目里的数据合成方法,如果不这么做还可以怎么做
3.问RAG的流程,知识库,检索方式,提示词怎么写的,问RAG里的一些问题,如果检索不到怎么办,如果知识库没结果怎么办等等
4.问DPO PPO GRPO原理,问loss怎么算的,对比
5.做DPO的时候调了哪个参数,有什么作用(beta)
6.transformer架构、注意力机制,问知不知道其他的除了
7.MHA之外的比如GQA等
8.手撕-旋转遍历矩阵
二面
1.介绍项目,问项目背景、项目里一些问题
2.讲了实习项目里DPO的一些设计
3.问知不知道模型训练的一些参数,答了温度参数、topp、top-k这些,然后问互相搭配的一些影响,问原理手撕-忘记了但也是力扣原题很简单
全部评论
请问什么学历呀
点赞 回复 分享
发布于 2025-12-28 19:00 广东
二面多久给通知啊?
点赞 回复 分享
发布于 2025-11-12 16:49 广东
收藏了,感谢大佬分享
点赞 回复 分享
发布于 2025-11-12 16:47 山东

相关推荐

蚂蚁国际 - AI风控 暑期实习一面 60min问八股:1.介绍一下transformer架构,它解决了rnn和cnn哪些无法解决的问题?2.怎么理解词与词之间距离的概念?为什么大模型需要知道这个距离?3.transformer的核心机制是什么?能不能用一个具体的例子串一遍里面所有概念?4.你提到的QKV能不能具体讲一下?它的核心作用是什么?5.模型层叠加之后会出现什么问题?我们要引入什么机制去解决这个问题?6.传统的残差机制会有什么问题?现在业界有没有提出一些新的解决方案?7.现在业界有很多先进的大模型,有些是7b,有些是325b,这个b的概念是什么?我们在做模型选择的时候怎么选?8.对于不同的细分领域,能不能讲一下你对现有的模型厂商他们参数量选型的了解?9.现在给你一个场景,比如说我们做ai coding,你会怎么去选择参数量?10.对话型模型和推理型模型之间的区别是什么?分别适用于什么样的场景?11.简要的介绍一下engine、sub engine、skill、mcp这几个概念,他们的用途是什么?在代码开发过程中分别用来解决什么问题?12.在开发过程中,多轮迭代会话后工程越来越难以维护,你有没有什么好的建议?13.对于上下文工程的最佳实践,常用到的一些技术或者解决方案都有哪些?14.目前这个体系还很复杂,有没有现成的东西来辅助我?有没有了解现在开源社区很火的一些解决方案?问实习:15.聊一下实习期间你遇到最困难的一件事,这件事你是怎么解决的?得到了一个什么样的效果或结果?16.为什么你会选择lsp这个方案?你是怎么找到和评估这个方案的?17.如果说进一步提升的话,你觉得还有什么方向可以改进?让你现在再做一遍的话你是否会选择重新设计?无手撕18.反问3.23面的,3.28收到感谢信,被老东家拷打麻了
查看17道真题和解析
点赞 评论 收藏
分享
评论
2
21
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务