高德大模型算法一面面经 1h

给我面没招了,发点面经攒攒人品~
1.项目拷打
2.语义漂移吗?如果遇到罕见病,模型产生‘幻觉对齐’导致误操,有没有方案去做兜底
3.在医疗决策里,‘兴趣’是伪命题,‘合规’才是核心。用常规的DIN是做用户兴趣建模,但把DIN 里的激活单元改成了双线性交互这会不会导致模型对‘强特征’(如过敏史)的敏感度被‘软语义’稀释?
4.知识库里既有权威指南又有脱敏病例。当这两者发生逻辑冲突时(比如新版指南否定了旧病例的方案),路由机制是怎么做确定性仲裁的?
5.说的算子融合具体是怎么做的
6.做生成式推荐重构,LLM虽然语义理解强,但天生带有选择偏见(。在冷启动场景下,怎么保证模型生成的物料序列不会陷入‘信息茧房’?
7.手术机器人的环境是很复杂的,比如它组织形变是不规则的。你提到的不确定性感知),具体是基于传统的卡尔曼滤波还是基于大模型的分层鲁棒控制?当模型预测的8.动作序列与传感器实时反馈发生显著偏离,怎么实现毫秒级的安全制动
9.用Pseudo-ID做时序追踪,但如果攻击者通过多维病理特征进行逆向重构,Embedding层做了哪些差分隐私处理
10.手撕:Transformer block实现
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 昨天 16:11 广东
拼多多春招各岗位开始啦:https://careers.pddglobalhr.com/campus/grad/detail?t=zkJ9niUSr6
点赞 回复 分享
发布于 昨天 15:54 上海

相关推荐

给我面没招了,感觉自己好菜、面试很难,还是要多多练习1.项目拷打2.你在去部署或者训练预训练或者后训练的模型时,有没有用过一些比较底层的一些训练的调试的工具,比如说千卡的话很容易就会出NCCL timeout,如果出现 NCCL timeout,一般怎么定位和解决?3.像那种rl里面的那个MOE之类的那种的优化有去做过吗4.看您的训练经验比较丰富,而且您上线运行的推理内容之前也进行过一些什么样的优化吗?5.有没有做过 kernel级别的优化?比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化,介绍一下6像底层,如果你们在做.kernel fusion,倾向于用什么方式来做7.有没有哪次你做了 fusion 结果性能反而下降的?原因是什么8.平时写 CUDA的时候,有没有关注到底层实现细节?比如你刚提到 FA2,那再往下一层,像 Hopper架构里那个 warp specialization是什么,它底层大概是怎么实现的9.试过用 Agent去生成cuda内核么,怎么去做的10.如果我把 warp specialization 去掉,只保留 tile 和 shared memory 优化,大概会损失在哪?11.怎么么判断一个 MoE 模型是真的学到了分工,而不是只是把 dense模型拆开了12.在 RL + MoE 里,有没有遇到过 reward把 routing学坏的情况?就是模型为了拿 reward,全都走某几个 expert,这种情况你当时是怎么处理的
查看11道真题和解析
点赞 评论 收藏
分享
昨天 12:00
已编辑
门头沟学院 Java
offer魅魔_oc...:100-200每天,你还要倒贴100
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务