阿里暑期agent算法二面 1h 攒人品

面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.实习 模型选型 function call流程 dpo优缺点
2.Agent是怎么选择工具的
3.对于一个边界不好定义的场景,类似skill这种形式不能很好区分场景披露工具,怎么办 sft和rag的适用场景  
4.RAG系统整体流程 对于不同类型的文档分块策略 
5.重排策略的选择 如果开发一个Agent,web socket和另一个什么选哪个
6.ai coding,对于一个客服Agent,当前的奖励函数有:Reward 7.hacking问题、稀疏问题、区分度太大问题(只有完全正确和错误),请设计新的reward解决至少两个,并且列5个case,其中需要包含边界和可能Reward hacking的case
全部评论
ai coding是会发一个链接做还是用本地的工具啊?
点赞 回复 分享
发布于 04-20 10:56 湖南

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务