阶跃星辰agent算法面经分享 攒人品中

发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.针对具体业务场景,怎么训练agent调用工具,奖励函数怎么设计和优化的
3.怎么优化RL训练agent调用工具的数据,数据配比策略是怎样的
4.训练agent调用工具,以react框架为例,plan是什么,提示怎么设计,Obersevation是什么?Action是什么?每一块的输入输出都是什么?长什么样的?
5.介绍一下trl/verl架构,有哪些类,主要参数,针对具体任务出现的一些具体情况怎么调参
6.用verl训agent调用搜索工具为例,讲一下每一类大致怎么设计,什么作用
7.用过其他什么框架,讲了llama factory,swift.问了数据构造、格式
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 今天 10:19 广东

相关推荐

今天 11:21
已编辑
东北大学 Java
又双叒叕忘记录音了QWQ凭记忆恢复了一下面试官挺和蔼的,面着没有压力问了些计网OS,快忘完了,基础不太牢面试官介绍部门业务(面试官先介绍给好评)自我介绍这两个项目你是都是从0到1自己设计实现的还是怎么做的项目1(传统后端):你是怎么借助AI进行开发的数据是存在库里还是缓存里,这个你是怎么考究的如果这个项目你还想更新一下,加一些功能或者是做一些优化,你会如何借助AI来完成这次更新迭代?项目2(Agent):这个项目有什么你觉得最难的点吗?(我回答上下文工程)那你是怎么解决上下文工程的呢?这个项目这些东西你是怎么进行学习、开发的?MCP和Skill了解吗?有什么区别?(答上了但没太答到位)除了SpringAI,还了解什么AI开发框架吗?除了这些AI开发的知识,有了解什么大模型的内容吗,比如transformer(没有,确实得去学了QWQ)八股:websocket和Http(不会)TCP的拥塞控制和流量控制操作系统有哪些资源分配算法(好像是问的这个,不太记得了,反正问的是操作系统的什么算法,没答上来)互斥锁和信号量键入一个url,发生了什么,从不同的角度来回答,包括计网层面发生了什么?前后端层面发生了什么?前端在获取到后端的数据后,是如何进行内容渲染的?(没系统学过前端,就只结合vue的三个板块答了答)算法题:很简单,一组字符串的最长公共前缀,遍历一次即可AI Coding:写一个前端页面,后端写假数据即可(面试官后面提醒我说要考虑接口超时、响应过久等情况如何处理)反问:1.看JD描述说是全栈,AI Coding,那还需不需要补一下前端知识?面试官说会肯定是加分项,但不会的话,现在也可以AI写了,所以也问题不太大(我大脑翻译一下意思就是还是得会,但实际开发更多是AI Coding)2.后续流程:两轮技术面,一轮Hr面3.看笔试都在出大模型的知识,是不是意味着现在开发岗也得了解大模型的一些原理了?面试官说是的,现在都在借助AI提效,所以里面的原理肯定还是得了解一下了
查看20道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务