字节筋斗云计划面经
1. 介绍项目;
2. 介绍 GRPO
3.GRPO 和其他强化学习的区别
4. 为什么 GRPO 不能用在下棋、魔兽这些游戏场景上,维度在 LLM 领域很受欢迎。
5. grounding 任务如何提升视觉模态和语言模态的交互来提升性能。
6.为什么无标注的数据飞轮能够实现模型的自进化?
7.代码:把n个骰子扔在地上,所有骰子朝上一面的点数之和为s。求s的所有可能的值以及出现的概率。(DP)
8.反问:工作内容和方向;计算资源。
2. 介绍 GRPO
3.GRPO 和其他强化学习的区别
4. 为什么 GRPO 不能用在下棋、魔兽这些游戏场景上,维度在 LLM 领域很受欢迎。
5. grounding 任务如何提升视觉模态和语言模态的交互来提升性能。
6.为什么无标注的数据飞轮能够实现模型的自进化?
7.代码:把n个骰子扔在地上,所有骰子朝上一面的点数之和为s。求s的所有可能的值以及出现的概率。(DP)
8.反问:工作内容和方向;计算资源。
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
10-12 19:23
重庆邮电大学 Java
敢逐云霄志:你打招呼语怎么能这么长,hr都没看下去的欲望,简明扼要说重点,就读于某某学校某某专业,26届应届毕业生,学信网可查,先后在某某公司实习过(如有),然后做过什么项目,想找一份什么样的工作,可实习几个月以上,期待您的回复。 点赞 评论 收藏
分享
10-19 18:20
福建师范大学 Java
下午吃泡馍:数字马力的薪资一般哇,5年经验的java/测试就给人一万出头,而且刚入职第三天就让人出差,而且是出半年
帮你内推|数字马力 校招 点赞 评论 收藏
分享