百度文心agent开发一面 85min
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.实习拷打
2.项目拷打
3.你们的 Agent 是单 Agent 还是多 Agent?为什么这么设计?有没有考虑过另一种方案?
4.Agent 任务是怎么拆分的?拆分粒度是怎么决定的?
5.上下文是怎么构建的?你们怎么避免上下文过长或者信息污染?
6.如果上下文窗口不够,你优先保留哪些信息?为什么?
7.你们做代码理解的时候,AST、调用关系这些信息是怎么用起来的?
8.单测生成里,哪些代码其实不适合生成单测?你们是怎么识别并过滤的?
9.覆盖率高但测试质量很差,这种情况你见过吗?你们是怎么解决的?
10.mock在单测里什么时候是必须的?什么时候反而会带来问题?
11.如果一个函数依赖数据库和RPC,你怎么让模型生成的单测还能稳定运行?
12.你们怎么评估生成单测的质量?除了覆盖率,还有哪些指标?
13.LLM的输入到底是什么?模型真正看到的是什么?
14.self attention的核心作用是什么,为什么要拆成 QKV?为什么attention 可以建模长距离关系,
15.为什么需要multi-head为什么 attention可以看成动态加权
16.同一个 token的 Q、K、V 为什么不一样?
17.attention复杂度很高,如果上下文特别长,你会怎么优化?
18.模型产生幻觉的时候,一般是什么原因?
工程上有什么办法降低
19.Python有多线程吗?GIL 是干什么的?什么时候多线程是有用的?
20.讲一下C++从源码到可执行文件的流程。
21.手撕:给定数组的区间中位数之和:给定一个长度为n的数nums,一个区间 [l, r] 的 中位数 为:如果区间长度是奇数:排序后中间的数,如果是偶数:排序后靠左的那个数,要求:计算所有子数组的中位数之和
1.实习拷打
2.项目拷打
3.你们的 Agent 是单 Agent 还是多 Agent?为什么这么设计?有没有考虑过另一种方案?
4.Agent 任务是怎么拆分的?拆分粒度是怎么决定的?
5.上下文是怎么构建的?你们怎么避免上下文过长或者信息污染?
6.如果上下文窗口不够,你优先保留哪些信息?为什么?
7.你们做代码理解的时候,AST、调用关系这些信息是怎么用起来的?
8.单测生成里,哪些代码其实不适合生成单测?你们是怎么识别并过滤的?
9.覆盖率高但测试质量很差,这种情况你见过吗?你们是怎么解决的?
10.mock在单测里什么时候是必须的?什么时候反而会带来问题?
11.如果一个函数依赖数据库和RPC,你怎么让模型生成的单测还能稳定运行?
12.你们怎么评估生成单测的质量?除了覆盖率,还有哪些指标?
13.LLM的输入到底是什么?模型真正看到的是什么?
14.self attention的核心作用是什么,为什么要拆成 QKV?为什么attention 可以建模长距离关系,
15.为什么需要multi-head为什么 attention可以看成动态加权
16.同一个 token的 Q、K、V 为什么不一样?
17.attention复杂度很高,如果上下文特别长,你会怎么优化?
18.模型产生幻觉的时候,一般是什么原因?
工程上有什么办法降低
19.Python有多线程吗?GIL 是干什么的?什么时候多线程是有用的?
20.讲一下C++从源码到可执行文件的流程。
21.手撕:给定数组的区间中位数之和:给定一个长度为n的数nums,一个区间 [l, r] 的 中位数 为:如果区间长度是奇数:排序后中间的数,如果是偶数:排序后靠左的那个数,要求:计算所有子数组的中位数之和
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
开发怎么问了这么多算法内容?
相关推荐
查看19道真题和解析 点赞 评论 收藏
分享