淘天Agent算法实习一面凉经
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1-实习拷打
2- 项目拷打
3- agent 通过 SFT 如何训练?SFT 和 RL 能使用一套数据集吗?
4- agent 训练过程中 工具调用本身 和 基于工具调用结果的后续内容生成,哪个对于 SFT 的依赖更大
5- 算法题:字符串最小编辑次数问题(动态规划问题)
1-实习拷打
2- 项目拷打
3- agent 通过 SFT 如何训练?SFT 和 RL 能使用一套数据集吗?
4- agent 训练过程中 工具调用本身 和 基于工具调用结果的后续内容生成,哪个对于 SFT 的依赖更大
5- 算法题:字符串最小编辑次数问题(动态规划问题)
全部评论
相关推荐
点赞 评论 收藏
分享

