实习面经-美团大模型机器学习 好难...

面的我口干舌燥,差不多75min
项目:
1.微调和强化学习想让模型学习到什么?
2.RAG如何进行构建的?
3.为什么选择微调8B的模型?为啥不用更小更大的模型?
4.为什么用DPO强化学习?
5.微调显存占用是多少?
6.微调占用的显存主要储存什么参数?
7.推理和训练的显存占用一样么?
8.如果不一样的话比例是多少?
9.为什么会有这样的比例?是什么原因导致的?
10.微调的LoRA参数是多少,为什么要这么设置?

八股:
1.讲讲DPO,GRPO,PPO的区别?
2.除了SFT,LoRA还知道哪些微调模型?
3.NF量化是什么?
4.量化有什么作用?
5.4-bit,8-bit,16-bit是什么意思?
6.训练和推理的时候用float量化还是int量化好?具体怎么体现的?
7.关于RAG还知道哪些检索方法和召回的方法?
8.FAISS库是干啥的?
9.FAISS主要储存什么?怎么使用的?
10.Mamba模型的架构(论文)
11.相比于linear attention,self attention有什么优势?
12.多模态有哪些模型?
13.CLIP模型的架构?
13.知道哪些市面上关于LLM和搜广推的结合的解决方案?
14.在处理长文本的时候,你有什么解决方法?
15.LoRA,QLoRA,Adapter LoRA的区别?
16.了解扩散模型么?

手撕:
最长连续系列
全部评论
mamba、clip也要问么?
点赞 回复 分享
发布于 02-09 05:12 美国

相关推荐

一、面试现场最常让手写的代码(高频必背)1. 路径/轨迹规划基础- A* 或 JPS 伪代码(C++/Python)- RRT / RRT* 极简实现(必考)- 栅格地图路径搜索、碰撞检测逻辑2. 机器人运动学(必问)- 多自由度机械臂正运动学(DH + 齐次变换)- 数值逆运动学(阻尼最小二乘 DLS)- 雅可比矩阵计算、奇异值判断- 自碰撞检测逻辑(面向人形/双足/多关节)3. 最优化基础(岗位核心:姿态最优)- 简单二次规划 QP 伪代码- 梯度下降 / 牛顿法求解姿态最优目标函数- 带约束优化(关节限位、避障、姿态平滑)4. 基础避障算法- 人工势场法(APF)- 动态窗口法 DWA 思路 + 伪代码- 基于距离场的碰撞规避逻辑5. 轨迹平滑- 五次多项式轨迹插值- B 样条 / 贝塞尔曲线- 最小 jerk / 最小加速度轨迹优化二、岗位核心专项:全身规划 & 通过性(重点准备)1. 全身运动规划(Whole-Body Planning)- 基于 QP 的全身控制伪代码- 浮动基机器人动力学简化(能讲+能写公式代码)- 重心优化、零力矩点 ZMP 简化计算2. 通过性(Passability / Navigability)- 地形评估、可达区域判断- 姿态自适应调整代码逻辑(爬坡、越障、台阶)- 多约束下姿态最优求解流程3. 姿态最优求解- 目标函数:能耗最小、姿态平滑、重心最低- 约束:关节限、碰撞限、视野/任务约束- 调用 OSQP / NLOPT / IPOPT 等求解器的代码模板三、Learning-Based 规划(加分但必准备)面试官不问代码也会问思路,最好能写极简示例- 简单强化学习:DQN/PPO 极简网络结构- 模仿学习:行为克隆(BC)极简训练+推理代码- 学习预测:简单 LSTM/Transformer 状态预测伪代码四、工程化 & 框架能力(面试官非常看重)1. 规划框架设计(C++)- 规划器基类 + 派生结构(AStar/RRT/MPC)- 线程安全、数据队列、回调机制- 模块解耦:感知→地图→规划→控制2. 仿真相关代码- MuJoCo / Gazebo 环境交互- 机器人状态读取、轨迹下发、碰撞回调- 批量测试、自动化评估脚本(Python)3. 常用开源库使用(必须会写调用代码)- OMPL 规划器调用- NLOPT / OSQP / qpOASES 求解器- Pinocchio / KDL 运动学动力学- Eigen 矩阵运算、SVD、雅可比五、如果时间紧,优先准备这 8 套代码1. RRT*(必背)2. 数值逆运动学(DLS)3. 雅可比与冗余机器人零空间优化4. 五次多项式轨迹5. 简单 QP 姿态最优求解6. A* 路径规划7. 全身规划优化伪代码8. 学习型规划(BC/PPO)极简示例银河通用目前有需求,招算法职位,地点北京和深圳,有兴趣接触可以私聊
点赞 评论 收藏
分享
评论
1
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务