算法打工人小旺

02-02 22:49 中山大学算法工程师发布于山东

关注

美团大模型算法岗面经

1.简历和论文
2.做 grpo 遇到熵崩没有？你是怎么理解的？
3.大模型容易 reward hacking，如何解决？
4.VLLM prefix cache实现过吗？
5.如何理解 dspo 这几个算法的创新？
6.长上下文压缩有哪些方法？
7.MOE 的 expert parallel 如何做的？
8.手撕： transformers encoder
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

_Amethyst_Adventure

南华大学产品经理

美团的也不简单啊

点赞回复分享

发布于 02-03 14:23 湖南

北京联合大学供应链管理

美团的薪资待遇如何

点赞回复分享

发布于 02-03 14:22 山东

02-24 12:02

武汉大学算法工程师

暑期实习简历，计划投大模型开发或者大模型算法岗，求指导[好无辜]

大佬们看看，简历是否合适。（两个项目的“主要工作”写的很粗糙）然后还有一个问题请大佬们支支招... 我想走大模型相关岗位，但没想好去算法还是开发。算法岗肯定是首选，主要是怕我的项目经历跟算法岗离得远找不到实习。请大佬们给给建议

简历中的项目经历要怎么写

点赞评论收藏

分享

03-02 15:04

北京大学算法工程师

我是如何准备大模型算法岗面试的？

很多人问我如何准备大模型的面试，分享下我的经验，针对两种情况：1. 有大模型实习2. 无大模型实习针对无大模型实习的情况，我建议先找一段中厂实习为主，比如 zhipu、Minimax （当然有大厂进大厂）这些，相对容易进，尽量积累大模型实习经历。针对有大模型实习的情况，复习内容为：1. 常规八股（transformer、bert 等）2. 最新八股（GQA 等）3. 技术报告（一定要自己看原PDF，目前推荐 DeepSeekV3, R1, kimi1.5, Minimax-01, Qwen2.5, Qwen2.5-VL）4. 手撕 Leetcode：Hot1005. 手撕模型，比如 MHA 这些首先是常规八股和最新八股，这一部分可以自己找找网上资料，整理好的，背。然后是技术报告，目前推荐的内容有：1. DeepSeekV3：必读2. DeepSeekR1：必读3. Kimi1.5：选读4. Minimax-01：选读，据我所知最长上下文模型（外推到 4M，不过好像被 LLama4 的 10M 超过了）5. Qwen2.5：必读6. LLama3.1：必读7. Qwen2.5-VL（如果简历有多模态内容）：选读重点关注：1. 阶段训练（预训练几段、Post-training 几段？上下文用了多少？数据配比是什么？）2. 模型创新点（MHA 创新是什么？作用是什么？）3. 上下文优化创新点（一般是优化显存和阶段训练）4. 多模态优化创新点（简历有多模态内容）5. 几个模型不同之处（比如 Qwen2 和 Qwen2.5 的不同之处）最后是手撕，Leetcode 只刷 Hot100 够了，模型手撕建议关注（我目前会的）：1. MHA2. LayerNorm3. Transformer Encoder (MHA+LayerNorm+FFN)4. PE（绝对位置编码）5. ROPE6. SwiGLU7. RmsNorm每次面试前快速过一遍就 ok 了。

喜欢吃卤蛋的托尼of...：大佬想问下项目该怎么准备

查看19道真题和解析

点赞评论收藏

分享

02-25 11:28

门头沟学院 C++

腾讯云智后端开发-C++ 一面

1. 自我介绍这个看个人具体情况了 2. 实习中测试业务介绍在实习期间，我xxxx 巴拉巴拉说一堆, 如果没有也不会问这条的 看个人情况3. 计算机网络分层介绍常见的网络分层模型有OSI七层模型与TCP/IP模型。OSI模型自下而上依次为物理层、数据链路层、网络层、传输层、会话层、表示层与应用层；TCP/IP模型通常划分为网络接口层、网络层、传输层及应用层。分层设计降低了系统复杂性，各层独立实现特定功能，方便维护与升级。4. TCP相较于UDP是可靠的原因TCP是面向连接的协议，在数据传输前必须建立可靠连接。它通过序列号、确认应答（ACK）、重传机制、流量控制和拥塞控制等手段来保证数据的有序、...

查看10道真题和解析

点赞评论收藏

分享

03-18 11:30

门头沟学院推荐算法

美团大模型算法实习面经

发点面经攒攒人品～1. 先answer后cot和先cot后answer，做SFT有什么区别？是否对比过效果？2. 怎么确保人工标注的数据准确率符合预期？3. 如何选择合理的SFT的checkpoint，用于后续的RL？4. 图片怎么输入模型的，一张图片有多少token？5. 你觉得RL和SFT有什么区别？6. 为什么不只做RL，而选择SFT then RL？7. 重要性采样是什么，为什么RL中要加入CLIP机制？8. On-policy和Off-policy有什么区别？八股1. Transformer的decoder中为什么要用自回归因果掩码？2. 缩放点积注意力为什么要除以$\sqrt d_k$？

查看10道真题和解析

点赞评论收藏

分享

03-12 12:02

门头沟学院 C++

腾讯微信客户端-C++ 二面

1、你做的高性能日志系统里最有挑战的是什么答案：高性能日志系统里最有挑战的部分通常不是把日志写出去，而是在高并发场景下同时兼顾吞吐、时延和落盘可靠性。如果每条日志都直接加锁写文件，线程一多就会在锁和系统调用上卡住，所以一般会把日志写入分成前台生产和后台刷盘两段。前台线程只负责把日志快速写入缓冲区，后台线程批量落盘。这样可以把大量小写合并成少量顺序写，减少系统调用和磁盘抖动。真正难的地方在于几个细节。第一是缓冲区切换时机，切得太频繁会增加刷盘压力，切得太慢又会拖高日志可见延迟。第二是满载场景下的回压策略，如果生产速度远大于消费速度，日志队列迟早会堆爆，这时要决定阻塞业务线程、丢弃低优先级日志，还...

C++ 常考面试题总结

点赞评论收藏

分享

评论

2

5

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 春招/暑实第一面是哪家？ #

29386次浏览 307人参与

# 军工所铁饭碗 vs 互联网高薪资，你会选谁 #

6281次浏览 32人参与

# 巨人网络春招 #

10898次浏览 164人参与

# 腾讯音乐求职进展汇总 #

160006次浏览 1100人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

185728次浏览 1103人参与

# 小红书求职进展汇总 #

226341次浏览 1351人参与

# MiniMax求职进展汇总 #

21251次浏览 273人参与

# 硬件人秋招的第一个offer #

122298次浏览 1453人参与

# 实习到现在，你最困惑的一个问题 #

31204次浏览 271人参与

# 如果重来一次你还会读研吗 #

229038次浏览 2009人参与

# 网易游戏笔试 #

6083次浏览 83人参与

# 职能管理面试记录 #

10402次浏览 57人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

6239次浏览 152人参与

# 正在春招的你，也参与了去年秋招吗？ #

361757次浏览 2628人参与

# 硬件应届生薪资是否普遍偏低？ #

108139次浏览 601人参与

# 简历中的项目经历要怎么写？ #

308497次浏览 4094人参与

# 工作中遇到的歹人 #

96276次浏览 535人参与

# 我的AI电子员工 #

34104次浏览 223人参与

# 校招笔试 #

461535次浏览 2943人参与

# AI时代，哪些岗位最容易被淘汰 #

60942次浏览 644人参与

# 你怎么看待AI面试 #

178487次浏览 1087人参与

# 如何一边实习一边找下家？ #

40316次浏览 349人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务