阿里暑期agent算法二面 1h 攒人品
面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.实习 模型选型 function call流程 dpo优缺点
2.Agent是怎么选择工具的
3.对于一个边界不好定义的场景,类似skill这种形式不能很好区分场景披露工具,怎么办 sft和rag的适用场景
4.RAG系统整体流程 对于不同类型的文档分块策略
5.重排策略的选择 如果开发一个Agent,web socket和另一个什么选哪个
6.ai coding,对于一个客服Agent,当前的奖励函数有:Reward 7.hacking问题、稀疏问题、区分度太大问题(只有完全正确和错误),请设计新的reward解决至少两个,并且列5个case,其中需要包含边界和可能Reward hacking的case
1.实习 模型选型 function call流程 dpo优缺点
2.Agent是怎么选择工具的
3.对于一个边界不好定义的场景,类似skill这种形式不能很好区分场景披露工具,怎么办 sft和rag的适用场景
4.RAG系统整体流程 对于不同类型的文档分块策略
5.重排策略的选择 如果开发一个Agent,web socket和另一个什么选哪个
6.ai coding,对于一个客服Agent,当前的奖励函数有:Reward 7.hacking问题、稀疏问题、区分度太大问题(只有完全正确和错误),请设计新的reward解决至少两个,并且列5个case,其中需要包含边界和可能Reward hacking的case
全部评论
ai coding是会发一个链接做还是用本地的工具啊?
相关推荐
bugo_:日常实习生***掉吗?还是暑期实习***掉 太哈人了
点赞 评论 收藏
分享
远航_随风:这什么扫码面试官,早点猝死在工位上得了😅
点赞 评论 收藏
分享
查看24道真题和解析