还是太菜了,下去沉淀一下1. 实习拷打2. 项目拷打3. 你针对图片的评测标准如何构建?4. 定义评测标准之后,是靠人去做吗,有没有自动化工具的引入?5. 评测集总共有多少条?6. 针对图片的一些图像检测算法有使用和引入吗?7. 你觉得从评测集的覆盖度上看,有什么缺陷吗?8. 从用户线上反馈来看,你觉得对于你评测集优化有什么帮助吗?9. 评测集构建过程中,自己构建和用户反馈各自占的比例大概是多少?10. 你对市面上主流的agent产品有了解吗?11. 就结合上面这个业务,如果让你设计一个agent,你会如何设计?考虑哪些点。12. 如果让你定义agent评测指标,你会关注哪些点?13. agent性能维度,你了解哪些指标?14. skill和tool的区别是什么?15. 模型的上下文压缩有了解吗?16. 你在实习过程中,有没有由你自己主导,实现并上线的一个功能,非执行层面的?17. 实现过程中,用了哪些开源的skill或者工具,解决了什么问题?