字节ai agent评测实习生-数据平台一二面凉经
一面时间:3.23
- 自我介绍
- 展开讲一下百度的实习(STAR法则)
- 讲解一下图片的评测集是如何设计的
- 评测执行中,有哪些自动化提效的部分
- agent skill做ui自动化实现细节?
- 测试case的覆盖度如何,通过率大概多少
- badcase主要集中在哪些部分?
- 针对badcase,解决思路是什么?
- 你编写的功能脚本主要解决了什么问题?
- 代码手撕:
如果给你一个包含1000条数据的JSON文件,请你用Python读取它,并统计其中某个字段(如label)的分布,你会怎么做?
- 反问环节。
二面时间:3.24
- 自我介绍
- 展开讲一下百度的实习(STAR法则)
- 你针对图片的评测标准如何构建?
- 定义评测标准之后,是靠人去做吗,有没有自动化工具的引入?
- 评测集总共有多少条?
- 针对图片的一些图像检测算法有使用和引入吗?
- 你觉得从评测集的覆盖度上看,有什么缺陷吗?
- 从用户线上反馈来看,你觉得对于你评测集优化有什么帮助吗?
- 评测集构建过程中,自己构建和用户反馈各自占的比例大概是多少?
- 你对市面上主流的agent产品有了解吗?
- 就结合上面这个业务,如果让你设计一个agent,你会如何设计?考虑哪些点。
- 如果让你定义agent评测指标,你会关注哪些点?
- agent性能维度,你了解哪些指标?
- skill和tool的区别是什么?
- 模型的上下文压缩有了解吗?
- 你在实习过程中,有没有由你自己主导,实现并上线的一个功能,非执行层面的?
- 实现过程中,用了哪些开源的skill或者工具,解决了什么问题?
- 反问环节。
