京东-大模型算法实习面经(凉凉

给我面没招了,发点面经攒攒人品~
1.项目拷打
2.拷打八股文:
①介绍一下Qwen系列模型的架构,训练方法。
②讲一下PPO、DPO和GRPO的区别。
③讲一下熵、交叉熵和KL散度的联系。
④讲一下DeepSpeed,DDP和FlashAttention。
⑤讲一下你为什么分类不用MSE。
⑥计算一下Qwen3-8b推理的时候需要多少的显存
⑦讲一下RAG的流程以及可以优化的策略
⑧讲一下PPO中优势是如何计算的。critic模型是如何更新的。
3.拷打实习:奖励函数是如何设计的呢?GRPO前有没有冷启动过程。
4.手撕GQA
全部评论

相关推荐

昨天 08:35
已编辑
浙江大学 Java
好焦虑。 来jd三周了第一周三天培训,两天熟悉项目技术。第二周熟悉项目框架业务。第三周也就是这一周,做了一个从数据库提数进行业务计算的活,前两天在写sql,后两天在折腾低代码工作流。虽然这个低代码工作流是我提出的,因为纯sql太复杂了,不好排查问题。下周要做的也就是一些小需求,虽然我看同期排班其他正职的活看上去也没多核心。之前还担心会做一些不是很后端的而偏ai的,网上又说纯后端好。但是这些天下来,组里里面也都是Java后端,我倒是又想学一些偏ai的东西。组里有ai的感觉最多就是调接口。工作流是平台的低代码dify类似的,拉拉模块写写js、python脚本。这种体量公司,mcp都一键化了,写个Java接口秒变mcp,都用不着自己写。这周折腾sql和调低代码工作流,耗费心力,没什么技术含量,就靠时间磨。这周SQL确实精进了不少,从只会增删改查(甚至不熟练),到现在能看懂、能写复杂语句,可这点进步根本压不住心里的焦虑。低代码工作流这种东西,谁来上手都能会,毫无技术壁垒可言。今天跟产品沟通,她早就玩得比我熟练,还反过来教我看工作流日志,女朋友在产品实习,平时也用低代码工作流。越想越觉得压抑,一周下来,除了SQL,其他全是原地踏步。工作流节点一多平台就卡到崩溃,跟问AI等半天、报错反复改再等半天一样,磨人心志。搞这些真的很好费时间,不能好好学想学的东西。心里有点想学python那些agent应用开发,感觉是趋势,又判断不清后端的路是否还是很有前景。同时又想着骑驴找马,想准备八股算法去其他公司。还要包装产出。实在是迷茫往哪个方向准备。我想四月中旬开始投暑期。我不是很想留北京,我想回杭州或者上海。南方人在北京生活不习惯,没有归属感。求职好难,找个工作好难。
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
正在热议
更多
# 一张图晒出你司的标语 #
4347次浏览 75人参与
# AI面会问哪些问题? #
28055次浏览 561人参与
# 开放七大实习专项,百度暑期实习值得冲吗 #
15300次浏览 222人参与
# 你的实习产出是真实的还是包装的? #
20278次浏览 342人参与
# 找AI工作可以去哪些公司? #
9228次浏览 241人参与
# 春招至今,你的战绩如何? #
65791次浏览 584人参与
# 厦门银行科技岗值不值得投 #
8059次浏览 188人参与
# 从事AI岗需要掌握哪些技术栈? #
9068次浏览 313人参与
# 中国电信笔试 #
32024次浏览 292人参与
# 你做过最难的笔试是哪家公司 #
33847次浏览 239人参与
# 投递几十家公司,到现在0offer,大家都一样吗 #
340890次浏览 2175人参与
# 哪些公司真双非友好? #
69639次浏览 289人参与
# 阿里笔试 #
178705次浏览 1317人参与
# 机械人避雷的岗位/公司 #
62704次浏览 393人参与
# 小马智行求职进展汇总 #
25133次浏览 80人参与
# 第一份工作一定要去大厂吗 #
14757次浏览 122人参与
# 金三银四,你的春招进行到哪个阶段了? #
22106次浏览 280人参与
# 为了减少AI幻觉,你注入过哪些设定? #
26266次浏览 310人参与
# 应届生第一份工资要多少合适 #
20691次浏览 86人参与
# 沪漂/北漂你觉得哪个更苦? #
9950次浏览 194人参与
# 聊聊你的职场新体验 #
336521次浏览 1895人参与
# HR最不可信的一句话是__ #
6312次浏览 114人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务