百度实习-Agent 算法一面分享

#开放七大实习专项,百度暑期实习值得冲吗# 给我面没招了,发点面经攒攒人品~
1.项目怎么做的,用了什么技术
2.单一Agent还是多Agent
3.Agent里面有几个工具
4.为什么不用大尺度模型或者新的模型,怎么考虑
5.数据怎么构建的,怎么评价数据的质量
6.强化学习中遇到了什么问题,因为强化学习很容易训崩,怎么解决
7.都是通过规则约束吗,没有中间过程的约束吗,要设计中间奖励
8.每一部分得分是多少,怎么计算这个得分
9.大模型多模态有了解吗
10.介绍一下子注意力机制
11.为什么除以根号d
12.grpo损失函数怎么计算,prompt怎么参与训练,怎么影响模型的训练
13.Lora微调原理,怎么初始化,智怎么考虑
14.为什么更偏向全量微调,全量微调比Lora微调好在哪里
15.了解kvcache吗,为什么没有q
16.vIlm原理
17.t怎么影响模型的推理能力
18.讲一下grpo算法
19.grpo不稳定的原因,有什么可以改进的地方
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 03-31 10:20 广东
感觉问的还行啊
点赞 回复 分享
发布于 昨天 23:30 北京
求问强化学习细节
点赞 回复 分享
发布于 03-31 20:33 辽宁

相关推荐

一面 - 自我介绍- 大模型和传统机器学习 / 深度学习有什么区别?- Agent 里的工具调用是怎么实现的?- 用 LangChain / Agent 框架时,一般要配哪些东西?- ReAct 是怎么用的?- ReAct 有什么缺点?- ReAct 的成功率怎么看?- 你用 ReAct 做过什么任务?- Plan-Exec 要解决什么问题?- 调 prompt 有什么规范?- 你调 prompt 遇到过什么 case?- 最近看过哪些前沿框架 / 记忆架构?- 你在记忆上有什么实践?- Skill 和上下文管理是什么关系?- 现场编码:链表分组反转 / 区间反转- 协程和线程区别是什么?- 协程中断和线程中断的区别?- Go 的 GC 做过什么优化?- GC 暂停时间一般多少?看过指标吗?- 数据库索引为什么用 B+ 树?- 堆的底层存储结构是什么?- channel 里有锁吗?实现看过吗?- 有缓冲 channel 用在什么场景?- 什么场景会出现 goroutine 泄漏?- 什么场景会用协程池 / worker pool?二面忘记录音了- 自我介绍- 项目拷打- 对redis的理解- 排序算法- 索引- 手撕 LC 33三面- 实习拷打- 手撕 LC 301三面后第二天OC
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务