你好这是校招吗?感觉和客户端没啥关系
点赞 评论

相关推荐

攒攒人品! 1.项目拷打2.vision-language 对齐是 joint embedding 的?,那做了哪种对齐?有做 hard negative mining 吗3.所有视角共享 encoder 吗?如何防止view collapse?4.semantic space是如何保证cross-modal consistency的5.用diffusion model做动作策略,是怎么建模action space的6.如果多个diffusion模型组合,用了 gating 机制还是 uncertainty-aware ensemble?那 uncertainty 是怎么量化的?有对比过 epistemic 和 aleatoric 吗?7.怎么防止action drift?有没有引入 consistency regularization或者temporal smoothness loss?8.在surgical robotics里policy failure cost 很高,是怎么做risk-aware training 的?有没有加入 CVaR loss10.模型泛化能力是靠数据多样性还是结构归纳偏置?能列出你设计中的 inductive bias 吗?对 unseen 手术任务怎么泛化11.surgical scene 变化很大,怎么办12.你说MAE 是做关键帧 reconstruction,那帧选择怎么做?具体打分逻辑是怎么样的13.有没有做 token-level saliency analysis?你怎么知道模型真的关注了 surgical tool 而不是 background?部署是在 ARM 上还是 X86?有没有模型并行?多线程和多进程各负责什么14.做多模态感知融合时,视觉、语言、触觉(如果有)延迟不同,怎么对齐的15.整个pipeline的E2E latency是多少?瓶颈在哪你说中间用了 LQR,你 gain matrix 是 constant 吗?有没有做 gain scheduling?基于什么指标调的16.控制系统稳定性你怎么保证?有没有做过 Lyapunov 函数证明17.做过 trajectory optimization 吗?是基于 collocation 还是 direct shooting18.假设你有个 policy 输出波动很大,你会考虑在 policy 层加高通滤波器还是在 loss 层加 penalty?为什么?19.diffusion policy 是连续动作空间,那你是建模 joint distribution 还是 marginal20.语言指令不是 deterministic 的,你们是直接用 language embedding 吗?有没有考虑language-conditioned latent variable model?
查看21道真题和解析
点赞 评论 收藏
分享
03-04 01:37
算法工程师
bg: 985本硕。现在主要研究视频生成,之前做过3d/4d、多模态(和推荐相关)。3个offer:1. 字节广告算法,1-2,n*15+3w期权。优点:字节的广告算法行业内应该算top级别,团队leader人也非常好。缺点:和个人背景没有那么匹配,也没有那么感兴趣,2. 卓驭科技(前大疆车载)多模态大模型(视频生成、vla等方向),(n+10k)*(12-17)。优点:薪资确实比字节高很多,方向也喜欢,个人觉得智驾和具身智能未来发展空间很大,哪怕未来智驾和具身未来不行,应该也可以跳槽到别的行业,毕竟做大模型的。缺点:强度应该比字节稍大,其他福利待遇比字节差一些,年终奖无保底(hr说绝大部分都能拿到4个月年终奖),公司在智驾行业不算第一梯队,网上信息也比较少,不清楚到底咋样,未来稳定性、业务发展、行业认可度(据hr说公司员工跳槽出去,行业认可度很高)等都不太清楚,但是看算法团队硕博比例很高,人才密度比较高,技术水平应该也还行。3. 华为2012实验室ai多模态(软件特战队),15a,40-50w。hr说进去之后会根据个人意愿匹配到对应的项目组,但是看网上有人说这个很坑,进去之后随便分,看运气,都是做算子开发的。面试过程也几乎没怎么问ai算法相关的,感觉面试官根本不懂ai算法。暂时不考虑华为了。求帮选,或者给些建议和信息,感谢。
校招薪资来揭秘
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务