小厂 Agent算法面经
1.介绍下你的DeepReseach的架构
2.项目是怎么实现human in loop的
3.讲一下异步同步和并发并行的区别
4.搜索的ReAct过程是怎么样的
5.Agent搜索有遇到什么问题,怎么解决
6.如何提升搜索的速度
7.讲一下VLLM的原理
8.你知道Flash Attention原理吗
9.讲一下你说的这个R1-V的Qwen2.5VL多模态几何题优化过程
10.你的训练平台和显卡配置是多少
11.讲-下Advantage Actor-Critic
12.讲一下PPO的clip函数,clip是梯度裁剪吗
13.讲一下重要性采样
14.讲一下PPO和GRPO的区别
15.如果要用强化学习实现DeepResearch的优化搜索工具调用可以怎么实现,从数据构造到损失函数到奖励设置
16.你有了解最新的一些工作吗?比如miromind,Qwen3-Next,deepseek的mHC流形约束超连接.
17.手撕二叉树的奇数节点个数
2.项目是怎么实现human in loop的
3.讲一下异步同步和并发并行的区别
4.搜索的ReAct过程是怎么样的
5.Agent搜索有遇到什么问题,怎么解决
6.如何提升搜索的速度
7.讲一下VLLM的原理
8.你知道Flash Attention原理吗
9.讲一下你说的这个R1-V的Qwen2.5VL多模态几何题优化过程
10.你的训练平台和显卡配置是多少
11.讲-下Advantage Actor-Critic
12.讲一下PPO的clip函数,clip是梯度裁剪吗
13.讲一下重要性采样
14.讲一下PPO和GRPO的区别
15.如果要用强化学习实现DeepResearch的优化搜索工具调用可以怎么实现,从数据构造到损失函数到奖励设置
16.你有了解最新的一些工作吗?比如miromind,Qwen3-Next,deepseek的mHC流形约束超连接.
17.手撕二叉树的奇数节点个数
全部评论
相关推荐
点赞 评论 收藏
分享


查看10道真题和解析