小红书 社区治理算法实习生
98投递
一面
是否接受上海base
科研论文经历,每一篇论文都深究了一下
多头自注意力,和MQA还有GQA区别
并行策略(deepzero)(没准备,不会)
PPO, DPO,GRPO区别
dpo的输入形式和SFT输入形式区别
做SFT或者DPO,怎么调整最终效果的,gradient step的含义是什么
做算法研究,是不是看论文比较多,工程上的工作会少一点(应该是觉得我代码写的少)
论文深究,然后给了个场景题
给大量的用户数据(表格数据),提出一种算法改进大模型去评估用户账号的健康程度(0-100),问了挺久也特别细
如果有过亿的用户数据,大模型推理太慢了,怎么想办法加快。
无代码题
反问
具体干什么工作(社区治理算法提升,删小红书有害的内容)
建议(没有,比较满意)
面试感觉还行,面试官也是zju学长,加分了