虾皮秋招算法一面

岗位:算法工程师 自然语言处理
面试 timeline:7.30
面试时长:1h
面试问题:
1. 什么是RL?
2. PPO、DPO、GRPO和GSPO的区别?
3. 其他都是业务问题
手撕算法:正则表达式匹配
反问:反问业务和校招生培养模式
面试感觉:面试官很温和,经历这块基本我讲的他都听懂了,八股GSPO讲的有点磕磕绊绊,但没有说我。

#我的秋招“寄”录##26届校招投递进展##面试问题记录##秋招笔面试记录##秋招笔面试记录#
全部评论

相关推荐

点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务