mini_35 - 个人主页动态 - 牛客网

05-05 06:20

门头沟学院算法工程师

腾讯TEG大模型算法暑期实习一面分享

发点面经攒攒人品～1.介绍主流 Transformer-based 模型架构2.讲一下 LoRA 原理3.为什么用 LoRA，而不用全量微调4.如何理解 LoRA 的核心假设：模型针对特定任务做下游微调时，权重矩阵更新具有极低的内在秩5.为什么 SFT 之后还要进行后训练6.讲一下 DPO 的损失函数怎么计算7.讲一下 GRPO 原理8.GRPO 和 PPO 的区别9.GRPO 的优点10.什么情况下使用 GRPO 效果会不好11.使用 GRPO 时，构造数据要符合什么要求12.为什么不用 GRPO 训练，而是用 DPO 训练13.熟悉哪些 Agent 框架14.如果要设计一个好的 Agent，除了大模型，还会设计哪些部分15.了解哪些训练框架16.怎么构造高质量训练集17.怎么体现训练集高质量18.多路 System 增强策略怎么做19.训练后的效果用什么指标评价20.Dense 模型和 MoE 模型有什么区别21.怎么评测训练效果22.了解哪些量化技术23.量化发挥作用的原理是什么24.讲一下 ZeRO-1、ZeRO-2、ZeRO-325.如果显存有限，会选择哪个方案训练26.了解投机解码技术吗27.讲一下投机解码技术原理28.算法题：LeetCode 56 合并区间

查看28道真题和解析

0 点赞评论收藏

分享

04-28 09:30

门头沟学院算法工程师

字节推荐算法实习二面分享 1h

感觉面完人都通透了，还是太菜了，下去沉淀一下1、xgboost用在了哪个环节，特征是实时更新的吗?2、介绍qwen的视觉编码器(siglip)，siglip相较于clip的改进3、clip的架构，有没有试过裁剪视觉编码器做消融4、dpo、ppo、grpo的原理以及缺陷5、lightgbm和xgboost模型的原理手撕:单词拆分

查看6道真题和解析

0 点赞评论收藏

分享

04-21 04:55

门头沟学院算法工程师

字节跳动大模型算法一面攒人品中

感觉面完人都通透了，还是太菜了，下去沉淀一下1- 拷打项目2- SFT 和 GRPO 在优化目标的区别3- GRPO 相关八股：4- Advantages 怎么算的；一组的大小这个超参数，如何影响模型训练5- 为什么全好或者全坏，那这一步就对模型训练不起作用6- GRPO 相比 PPO 的改进，好处是？7- PPO 的 Advantages 具体是怎么计算的8- code：买卖股票的最佳时机（I 和 II）

查看6道真题和解析

0 点赞评论收藏

分享

04-15 08:00

门头沟学院算法工程师

阿里大模型算法一面实习分享

攒攒人品！有面试过同岗的朋友欢迎评论区交流1、都知道哪些vllm的优化技术？2、在现有模型的基础上，由于算力问题，如何利用大模型来蒸馏一个3B的模型？3、logistic回归的模型原理和loss。4、给定一个时间序列，如何通过机器学习的方法进行建模筛选出来重要的特征，然后基于规则方法进行建模5、DeepSeek-MTP是用在训练阶段还是推理阶段的，具体过程是怎样的？6、在现有大模型的基础上，如何通过agent的相关方法，训练一个coder模型，撰写金融领域相关模型的代码。

0 点赞评论收藏

分享

04-11 12:30

门头沟学院算法工程师

京东日常实习机器学习一面分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.实习拷打2.项目介绍3.如何从数据层面判断负迁移？用哪些指标来衡量负迁移的严重性4.其他商业化的部门更看重什么指标的优化？5.神经网络的权重初始化是怎么做的？如果全初始化为0有什么后果6.怎么做的负采样？手撕：最长连续子数组

查看6道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务