03-30 12:34 门头沟学院算法工程师

关注

阶跃星辰agent算法面经分享攒人品中

发一下问题给大家参考，攒攒人品！有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.针对具体业务场景，怎么训练agent调用工具，奖励函数怎么设计和优化的
3.怎么优化RL训练agent调用工具的数据，数据配比策略是怎样的
4.训练agent调用工具，以react框架为例，plan是什么，提示怎么设计，Obersevation是什么？Action是什么？每一块的输入输出都是什么？长什么样的？
5.介绍一下trl/verl架构，有哪些类，主要参数，针对具体任务出现的一些具体情况怎么调参
6.用verl训agent调用搜索工具为例，讲一下每一类大致怎么设计，什么作用
7.用过其他什么框架，讲了llama factory，swift.问了数据构造、格式

全部评论

推荐最新楼层

上海工程技术大学科研人员

请问有手撕吗？

点赞回复分享

发布于 05-10 16:35 北京

家族企业准备上市

Massachusetts Inst. of Technology 项目经理

奖励函数咋设

点赞回复分享

发布于 04-09 13:48 北京

哈哈哈，你是老六

门头沟学院大数据开发工程师

可以的，感觉写的还行

点赞回复分享

发布于 04-05 22:40 北京

04-26 17:16

已编辑

吉林大学 C++

文远知行笔试

文远的笔试是26号早八到晚九之间随便选俩小时笔试就行,用的是牛客oj.不让泄题,那就透露一下做法... 俩小时笔试,笔者做完还剩半个小时,可还行...T1首先有一个很容易想到的O(n^3)区间dp做法,交了过60%. 然后发现这个区间覆盖问题可以转化为图论找最短路,写了一个O(n^2logn)的做法,交了过80%. 然后不会了,尝试玄学优化,限制加边的数量,在WA和TLE之间徘徊几发之后过了. 后续问AI都说是斜率优化,吓哭了(笔者不会斜率优化).T2很简单的贪心题,没想到签到居然在T2.T3LCA板子题.经典结论: 设树上uv路径上所有点的权值和为 f(u,v) ,那么 f(u,v)=f(u...

点赞评论收藏

分享

04-17 00:10

门头沟学院算法工程师

27实习-阶跃星辰llm agent一面

发点面经攒攒人品！！！项目深挖八股：1. lora初始化，ab矩阵，设计原理2. dpo数据制作方法，数据格式，如何评价质量3. sft和dpo的原理和目的4. 如何判断dpo学偏，如何解决5. workflow链路设计要注意的点6. 生成任务中的temperature如何设计，低温重复应该如何解决手撕：lc209 长度最小的子数组

查看6道真题和解析

点赞评论收藏

分享

04-20 09:49

门头沟学院 Java

淘天三面是技术面还是 hr 面？

淘天一共多少面啊？如何看淘天三面是技术面还是 hr 面呀？我这显示一个小时的面试，如果是三面技术面一般问些啥呢，有无面经😬

点赞评论收藏

分享

05-12 15:12

门头沟学院 Java

阶跃星辰面试

有最近面这个公司的友子吗，研发

点赞评论收藏

分享

05-05 16:39

华南理工大学 C++

文远知行系统测试

有没有uu知道文远知行的工作强度咋样？

文远知行工作强度 388人发布

点赞评论收藏

分享

评论

点赞

4

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 26届春招投递记录 #

19495次浏览 141人参与

# 米哈游笔试 #

709094次浏览 1268人参与

# 我的求职总结 #

491028次浏览 6900人参与

# 你遇到过哪些神仙同事 #

145155次浏览 769人参与

# 27届实习投递记录 #

90411次浏览 949人参与

# 产品实习，你更倾向大公司or小公司 #

230313次浏览 2151人参与

# 金融银行求职进展汇总 #

363403次浏览 1979人参与

# 美团秋招笔试 #

219433次浏览 1198人参与

# 25届网易互娱暑实进度 #

110417次浏览 805人参与

# 我是XXX，请攻击我最薄弱的地方 #

98846次浏览 650人参与

# 拼多多工作体验 #

63447次浏览 441人参与

# 选择和努力，哪个更重要？ #

216067次浏览 1586人参与

# 国庆前的秋招小结 #

301993次浏览 1755人参与

# 宁德时代求职进展汇总 #

188635次浏览 710人参与

# Vibe Coding 会干掉初级岗位吗？ #

52605次浏览 337人参与

# 实习转正进行时 #

198301次浏览 1172人参与

# 职场吐槽大会 #

362015次浏览 2308人参与

# HR最不可信的一句话是__ #

37221次浏览 186人参与

# 牛油的搬砖plog #

208418次浏览 1338人参与

# 工作中哪个瞬间让你想离职 #

137316次浏览 810人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务