抖音大模型算法校招一面 base北京

1.论文用了哪些 RL 算法? 为什么用 DAPO,论文怎么写的?
2.DAPO 超参数对你的领域影响是什么? 你觉得 Clip higher 为什么起作用
3.还有哪些 RL 算法,GSPO 了解过吗? 为什么你的 ACL 的 Agentic 没有用 GSPO?
4.MLLM 训练有哪些节省内存方法?
5.相比较 CV 的小模型,MLLM 你的部署有哪些 trick? 推理加速有什么方法吗?
6.对个人信息 memory 检索和存储有什么好的 trick 和 idea?
7.agentic 思维链信息过长优化方法? 超出上下文导致遗忘或者幻觉严重你是如何解决的?
8.手撕:最长字符子序列
9.反问:业务内容
全部评论

相关推荐

不愿透露姓名的神秘牛友
昨天 09:26
点赞 评论 收藏
分享
昨天 03:19
门头沟学院 Java
主包家境中等,能支持在一线城市定居,目前手上有两个offer:1.pdd,后端,主站很核心的业务,总包2-3n,小sp应该,作息10106,优点涨薪快2.交行数据中心,运维岗,955,稳定,一周可能有两天加班到10点,一个月值班24小时一次,晚上可以睡公司客房,总包n,有补充公积金和年金,包第一年住房,以及每个月的餐补费,天花板薪资应该是40-50w之间,需要熬年限以及运气~两个工作都在上海。目前有几个想法or情况,列一下:1.如果选择pdd,考虑到众所周知的难跳槽问题,我打算进去干5年以上然后辞职回到老家,然后用存款去理财躺平。但主包是比较佛系(略摆)的人,复盘和学习能力一般,担心是否能撑住绩效压力,卷过其他的同事。这个应该算是互联网普遍的问题。2.如果选择交行,则需要父母全力支持上海住房问题,然后领取固定工资以及去能力化,工作上的压力可能会小点,我觉得我也能完全hold住这种工作,生活上的压力会比较大。但自身的个人时间就比较多了,我觉得留出额外的时间来发展自身其他方面也蛮重要的。3.我个人觉得互联网和wlb是不兼容的,wlb的工作很难有较高的薪资(大佬除外),如果去互联网我肯定奔着以赚钱为目标去,所以会向薪资看齐。之后春招应该还会面其他互联网公司,但个人觉得以自身水平很难能拿到更高的薪资水平的offer了希望大家能帮忙投投票,也发表一下自己的观点想法,一起讨论下~此贴也可以作为一个讨论互联网&国央企的帖子,我觉得应该有很多校招投递央国企和互联网的同学,大家也可以讨论讨论,当今环境去央国企还是互联网好一点呢?
offer帮选
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务