03-30 13:27 门头沟学院算法工程师

关注

阿里淘天大模型春招二面-搜推产品部

发点面经攒攒人品～
1-项目拷打
2- 后来有哪些比较经典的基于Transformer的语言模型，Qwen相比于原始Transformer有哪些结构上的改动
3- 了解RLHF吗，DPO和PPO有什么区别，Loss是什么样的，各自的优缺点是什么
4- 介绍一下CLIP，还了解什么其他的对比学习方法
5- 开放题：了解哪些多模态大模型，目前多模态大模型最大的问题是什么
6- 代码：1143.最长公共子序列

全部评论

推荐最新楼层

上海交通大学算法工程师

强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

1 回复分享

发布于 03-31 10:19 广东

哈哈哈，你是老六

门头沟学院大数据开发工程师

感觉问的似乎不多啊

点赞回复分享

发布于 04-05 22:47 北京

03-25 16:19

武汉大学 Java

京东jdy 平台产品与研发中心一面

八股java反射的原理哪些框架用到了反射java中除了synchronized还了解哪些锁线程池的参数，实际使用的时候参数怎么设置的concurrenthashmap原理什么是覆盖索引mysql慢查询排查及原因实习拷打（巴拉巴拉）另一个面试官：最近遇到的最大困难实习期间的收获设计一个查找方圆3公里的骑手并通知接单抢单

查看10道真题和解析

点赞评论收藏

分享

03-27 00:10

门头沟学院 Java

阿里淘天AI Agent二面面经分享

继续来分享下之前的面经~1.介绍RAG项目，整体架构和实现思路2.RAG中的检索模块召回错误结果时，你会如何处理？3.RAG出现漏召的情况，你会如何优化检索模块？4.如何评估RAG系统的效果？有哪些评估指标？5.解释LoRA高效参数微调的原理，为什么要用低秩分解？6.DPO训练中模型输出变长是什么原因？如何解决？7.大模型出现复读机现象的原因是什么？有哪些解决方法？8.SFT微调后模型的通用能力出现遗忘，你会如何处理？9.Wide&Deep模型的原理是什么？Wide部分和Deep部分分别解决什么问题？10.DIN模型相比传统推荐模型有什么改进？11.L1正则和L2正则的区别是什么？从数学角度解释为什么L1能产生稀疏性？12.SQL：统计每个商家的评论数并去重13.手撕代码：编辑距离

不想打工的加菲猫很慵...：这个ai优化还是ai应用开发岗位呀

查看13道真题和解析

点赞评论收藏

分享

03-29 00:13

广西大学算法工程师

阿里 AI Agent 开发二面

1. 大语言模型的 RLHF 训练流程是什么，它存在哪些潜在风险RLHF 一般分三步。第一步是 SFT，用高质量指令数据把基座模型调成能听懂任务、按格式回答的模型。第二步是训练奖励模型，把人工偏好数据整理成 chosen 和 rejected 形式，让奖励模型学会判断两个回答哪个更好。第三步是强化学习优化，最经典的是 PPO，让当前策略在奖励更高的方向上更新，同时用 KL 约束避免模型偏离初始策略太远。它的风险主要在三个地方。第一，奖励模型可能学偏，模型最后学到的是“讨好奖励模型”而不是真正更有帮助。第二，强化学习阶段如果约束不够，模型容易出现 reward hacking，看起来分数高，但真...

AI-Agent面试实战...

点赞评论收藏

分享

03-25 08:30

西安交通大学算法工程师

阿里大模型算法面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你在去部署或者训练预训练或者后训练的模型时，有没有用过一些比较底层的一些训练的调试的工具，比如说千卡的话很容易就会出NCCL timeout，如果出现 NCCL timeout，一般怎么定位和解决？3.像那种rl里面的那个MOE之类的那种的优化有去做过吗4.看您的训练经验比较丰富，而且您上线运行的推理内容之前也进行过一些什么样的优化吗？5.有没有做过 kernel级别的优化？比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化，介绍一下6像底层，如果你们在做.kernel fusion，倾向于用什么方式来做7.有没有哪次你做了 fusion 结果性能反而下降的？原因是什么8.平时写 CUDA的时候，有没有关注到底层实现细节？比如你刚提到 FA2，那再往下一层，像 Hopper架构里那个 warp specialization是什么，它底层大概是怎么实现的9.试过用 Agent去生成cuda内核么，怎么去做的10.如果我把 warp specialization 去掉，只保留 tile 和 shared memory 优化，大概会损失在哪？11.怎么么判断一个 MoE 模型是真的学到了分工，而不是只是把 dense模型拆开了12.在 RL + MoE 里，有没有遇到过 reward把 routing学坏的情况？就是模型为了拿 reward，全都走某几个 expert，这种情况你当时是怎么处理的

查看11道真题和解析

点赞评论收藏

分享

04-02 17:27

已编辑

门头沟学院 GIS工程师

京东零售-平台产品与研发中心-4.2一面

部门做的业务是AOI和POI相关的高并发LBS，面试前复习了一下八股和项目，还看了几个京东零售的面经，结果全程在问我高并发点、线、面计算之类的（可能是因为我是地信专业简历上带了个GIS项目），怎么和别人的面经不一样啊呜呜呜1.自我介绍（本人一段GIS后端的单体项目实习，完全没有接触过高并发下的LBS，还有两个项目，一个RAG，一个仿12306）2.详细说一下你们的空间查询是怎么做的3.也就是画了一个围栏之后，查围栏里面的点，那你知道怎么判断一个点在不在围栏内吗，包含函数的原理是什么4.那你了解空间索引吗5.那Geohash或者四叉树你了解过吗6.墨卡托投影呢7.（假设场景）如果在高并发场景下，...

查看21道真题和解析

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

34609次浏览 433人参与

# 大学生该如何认清当下的就业环境？ #

162403次浏览 888人参与

# 有哪些公司在面试时考察AICoding？ #

19325次浏览 349人参与

# 运营来爆料 #

98815次浏览 508人参与

# HR面都在聊什么？ #

13754次浏览 163人参与

# 美团开奖 #

407786次浏览 1805人参与

# 26届春招投递记录 #

3636次浏览 42人参与

# 百度工作体验 #

325416次浏览 2247人参与

# 想从事Agent应该学习哪些技术？ #

8566次浏览 288人参与

# 实习学到最有价值的工作习惯 #

69637次浏览 552人参与

# OPPO求职进展汇总 #

809054次浏览 5441人参与

# 校招生月薪1W算什么水平 #

143436次浏览 492人参与

# 你觉得什么岗位会被AI替代 #

57239次浏览 371人参与

# 从投递到OC，你用了多久 #

23812次浏览 240人参与

# 什么人最适合大厂？ #

12759次浏览 133人参与

# 父母问你工作找得怎么样，怎么回 #

23088次浏览 284人参与

# 哪些公司面试还在问八股？ #

14096次浏览 125人参与

373901次浏览 2921人参与

# 我与AI的日常 #

3270次浏览 16人参与

# 我的求职进度条 #

1114500次浏览 8049人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务