小红书 社区治理算法实习生

98投递

一面

是否接受上海base

科研论文经历,每一篇论文都深究了一下

多头自注意力,和MQA还有GQA区别

并行策略(deepzero)(没准备,不会)

PPO, DPO,GRPO区别

dpo的输入形式和SFT输入形式区别

做SFT或者DPO,怎么调整最终效果的,gradient step的含义是什么

做算法研究,是不是看论文比较多,工程上的工作会少一点(应该是觉得我代码写的少)

论文深究,然后给了个场景题

给大量的用户数据(表格数据),提出一种算法改进大模型去评估用户账号的健康程度(0-100),问了挺久也特别细

如果有过亿的用户数据,大模型推理太慢了,怎么想办法加快。

无代码题

反问

具体干什么工作(社区治理算法提升,删小红书有害的内容)

建议(没有,比较满意)

面试感觉还行,面试官也是zju学长,加分了

全部评论
让学长给你开后门
点赞 回复 分享
发布于 昨天 17:20 北京

相关推荐

评论
2
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务