百度实习-Agent 算法一面分享

#开放七大实习专项,百度暑期实习值得冲吗# 给我面没招了,发点面经攒攒人品~
1.项目怎么做的,用了什么技术
2.单一Agent还是多Agent
3.Agent里面有几个工具
4.为什么不用大尺度模型或者新的模型,怎么考虑
5.数据怎么构建的,怎么评价数据的质量
6.强化学习中遇到了什么问题,因为强化学习很容易训崩,怎么解决
7.都是通过规则约束吗,没有中间过程的约束吗,要设计中间奖励
8.每一部分得分是多少,怎么计算这个得分
9.大模型多模态有了解吗
10.介绍一下子注意力机制
11.为什么除以根号d
12.grpo损失函数怎么计算,prompt怎么参与训练,怎么影响模型的训练
13.Lora微调原理,怎么初始化,智怎么考虑
14.为什么更偏向全量微调,全量微调比Lora微调好在哪里
15.了解kvcache吗,为什么没有q
16.vIlm原理
17.t怎么影响模型的推理能力
18.讲一下grpo算法
19.grpo不稳定的原因,有什么可以改进的地方
全部评论
感觉问的还行啊
点赞 回复 分享
发布于 04-01 23:30 北京
求问强化学习细节
点赞 回复 分享
发布于 03-31 20:33 辽宁

相关推荐

03-24 06:35
门头沟学院 Java
给我面没招了,发点面经攒攒人品~1.项目拷打2.提示词模板是怎么设计和迭代的?你怎么判断一个模板是真的更好了?3.你们的 Agent 是单 Agent 还是多 Agent?为什么这么设计?有没有考虑过另一种方案?4.Agent 任务是怎么拆分的?拆分粒度是怎么决定的?5.上下文是怎么构建的?你们怎么避免上下文过长或者信息污染?6.如果上下文窗口不够,你优先保留哪些信息?为什么?7.你们做代码理解的时候,AST、调用关系这些信息是怎么用起来的?8.单测生成里,哪些代码其实不适合生成单测?你们是怎么识别并过滤的?9.覆盖率高但测试质量很差,这种情况你见过吗?你们是怎么解决的?10.mock 在单测里什么时候是必须的?什么时候反而会带来问题?11.如果一个函数依赖数据库和RPC,你怎么让模型生成的单测还能稳定运行?12.你们怎么评估生成单测的质量?除了覆盖率,还有哪些指标?13.LLM 的输入到底是什么?模型真正看到的是什么?14.self attention 的核心作用是什么?为什么要拆成 QKV?为什么 attention 可以建模长距离关系,15.为什么需要 multi-head为什么 attention 可以看成动态加权16.同一个 token 的 Q、K、V 为什么不一样?17.attention 复杂度很高,如果上下文特别长,你会怎么优化?18.模型产生幻觉的时候,一般是什么原因?工程上有什么办法降低
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务