快手实习 大模型算法面经 攒人品
发点面经攒攒人品~
1.项目拷打
2.实习拷打
业务背景
用的是什么模型
数据是如何获取和构造的(清洗去重过滤)
SFT阶段有哪些badcase又是怎么解决的?
为什么要用R?
GRPO的奖励函数是如何设计的?最终的结果是什么?
3.项目:你的agent是如何实现上下文压缩和记忆管理的?多个agent之间是如何进行通信的?
4.场景题:如果我们这边的agent对于用户意图识别不准确,在工程上有哪些方法进行优化。
5.算法题:面积最大的正方形,返回其左上角位置
1.项目拷打
2.实习拷打
业务背景
用的是什么模型
数据是如何获取和构造的(清洗去重过滤)
SFT阶段有哪些badcase又是怎么解决的?
为什么要用R?
GRPO的奖励函数是如何设计的?最终的结果是什么?
3.项目:你的agent是如何实现上下文压缩和记忆管理的?多个agent之间是如何进行通信的?
4.场景题:如果我们这边的agent对于用户意图识别不准确,在工程上有哪些方法进行优化。
5.算法题:面积最大的正方形,返回其左上角位置
全部评论
相关推荐
iiooz:别想太多了,面试官如果看不上,就不会约面了,腾讯很少所谓的kpi,有面就说明能力肯定不错,只是每个面试官筛选方式不同,二面甚至只跟你聊生活的都有,鹅还是很开放的在筛选人这一块 点赞 评论 收藏
分享
查看23道真题和解析