不怕拒绝 - 个人主页动态

02-05 15:15

总时长50分钟左右，攒人品中...1 实习介绍2 常见的的大模型，或者说VLM这块的模型，了解过哪些?3 Qwen 2.5 VL相对Qwen 2 VL做了哪些改进?4.追问了M-RoPE比原来的ROPE有什么改进?有什么优点?5.原来的ROPE在升级成M-ROPE之前，它是怎么处理视频的?具体来说，对于每一个每一帧或者说每一个patch，是怎么处理的?6.然后互相聊了不少项目，偏聊天风格，基本都是short talk，并不都是问答7 项目:主要想解决的核心问题是什么?8.项目:既然是一个垂类的一个场景，为什么要去用通用场景下的VLM来做?为什么不用已经具有领域知识的一些模型?9.项目:为什么你的VLM是输出点的坐标，而不输出bbox呢，bbox按道理比点的坐标具有更多的图像信息吧?10讲一下SAM2分割模型的原理11 项目:SFT框架用的是什么?12 项目:SFT数据的合成pipeline，详细讲解一13 项目:数据是用算法生成的，你们怎么判断这一批数据是好的还是不好的呢?14 算法题:lc70 爬楼梯

查看12道真题和解析

0 点赞评论收藏

02-05 08:35

西安交通大学算法工程师

快手多模态大模型一面凉经

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1. 实习介绍2. 项目拷打3. 4B的模型部署需要多少显存？怎么算的？4. （项目）LoRA的数据怎么来的，结构长啥样？5. 说一下LoRA的原理；怎么理解“低秩”（r为什么远小于d）6. 了解Agent吗？说一下你做过的Agent workflow的具体流程7. 说一下LSTM的原理；其中门控机制提出是为了解决什么问题？8. 手撕代码：多头注意力；约瑟夫环

查看8道真题和解析

0 点赞评论收藏

02-05 05:35

西安交通大学算法工程师

美团实习推荐算法一面 60min

项目: 1.初始特征的处理2.考虑过的损失函数有哪些，为什么最后选这个3.热门item采样为什么要做去偏八股:1.什么是sideinfo2..召回链路里常见的正负样本采样方法3.短期序列建模常见模型对比手撕:1.K个排序数组的合并(改编自 LCR078.合并K个升序链表 )

查看7道真题和解析

0 点赞评论收藏

02-04 15:15

西安交通大学算法工程师

字节大模型算法一面凉经-日常实习

1. 项目和八股介绍一下你做的这个项目为什么没有用 nsp，只用了 mlm分析一下transformer训练过程中显存占用和计算复杂度- 优化器 参数 梯度- 面试官说到：激活值也需要保存  训练过程中怎么去做到对激活值的显存占用，有什么参数可以进行控制 （答了混合精度，面试官说不对- 激活显存 ≈ `batch_size × seq_len × hidden_dim × n_layers × bytes_per_element`- 设置bs相关，也就是使用梯度检查点（Gradient Checkpointing），将大的bs分割成小的micro-bs来计算，最后进行一个统一PPO DPO GRPOclip可以限制分布差异  还有哪些方法KL 散度公式2. 手撕给定两个叶子节点，在二叉树中找到两个节点的最近公共祖先，空间复杂度要求o(1)。每个节点存在指向父节点指针

查看8道真题和解析

0 点赞评论收藏

02-04 05:20

西安交通大学算法工程师

百度aigc多模态算法实习三面

1. 实习介绍2. 介绍一下自己做过的项目（ baseline论文是什么，贡献点 ）。介绍一下我做的改进;问论文视觉是用的什么？3. 基于DAPO: 为什么对于长CoT加更多权重就会有用？4. 问我熟悉主流的VLM的架构吗？（我说比较熟悉llava，让我介绍一下）；问我llava 的projecter有哪几种？5. 问long video understanding有什么关键的问题？6. 介绍一下稀疏帧采样的方法都有什么；7. 常规问题：deepspeed优化架构？DP了解吗，介绍下DP？normalization是放在激活函数之前还是之后，放在之前有什么好处？问我是否熟悉：RMS norm，layer Norm，激活函数（llava的），q-former，qk norm，rope，swigle8. 手撕： 写一个layer norm

查看11道真题和解析

0 点赞评论收藏

02-04 01:40

西安交通大学算法工程师

字节大模型算法实习二面 65min

1.实习介绍2. RPC 与路由器的网络层级3.Python 调用 C++ 库（Ctypes, Pybind11 等）4.协程 (Coroutine)5.Vue2/3 数据双向绑定6.Node.js vs Python 并发 & Async/Await 区别7.JSON 数组转树形结构

查看7道真题和解析

0 点赞评论收藏

02-03 17:50

西安交通大学算法工程师

京东产研搜索算法日常实习一面

0 点赞评论收藏

01-31 12:35

西安交通大学算法工程师

实习面经-快手NLP算法hr面

1.很多大模型的岗位，具体怎么选择，有什么考虑2.读博or大厂3.实习预期收获什么4.还有哪些流程5.面试对岗位感受是否匹配6.在学校和实习做业务遇到的困难、问题可能会有什么不一样

查看6道真题和解析

0 点赞评论收藏

01-30 20:05

西安交通大学算法工程师

滴滴LLM大模型实习一面凉经

自我介绍 提问项目：1.gspo和grpo区别，损失函数2.ppo和grpo区别3.强化学习的理解（reward是否需要某一步突然特别好等等）4.策略模型和参考模型如何设计5.rag的架构，如何分块八股：1.transformer结构2.介绍一下微调有哪些3.为什么更多用lora这种泛式，而不是prefix tuning手撕：lc 旋转图像

查看9道真题和解析

0 点赞评论收藏

01-30 16:03

西安交通大学算法工程师

期待一个牛逼的男神来拯救我的coding

本人男，学码特别痛苦，期待一个牛逼的男神来拯救我的coding他一把夺过我的电脑边写code边说"你的痛苦 我都心疼想为你解决"

AI时代的工作 VS 传...

0 点赞评论收藏

01-30 09:50

西安交通大学算法工程师

字节大模型算法面经

1.项目介绍2.训练样本大概多少条3.为什么会想在重排做生成式4.如果是做生成式召回应该对模型结构怎么修改5.有考虑用别的强化学习的方法吗6.dpo 的公式是什么7. grpo 了解吗8.beamsearch 怎么做的9.大模型了解多少，强化学习了解什么10.手撕 transformer 并计算 flops 和内存开销

查看10道真题和解析

0 点赞评论收藏

01-22 16:13

西安交通大学算法工程师

豆包VS微信这波你站谁？

字节和中兴合作，推出了一款搭载豆包手机助手的手机。这个助手从系统层面嵌入了 AI 功能，可以通过模拟点击的方式智能化地帮用户操作手机里的 App。结果在自动化操作微信时，被强制登出了。网上很多人调侃说，新手机还没收到，就被微信给禁了。一部分人支持微信，认为用户隐私很重要。一部分支持豆包，认为AI发展大势所趋，而且能增加效率和便捷性的工具为什么不用？关键是监管。这波你站谁？

AI coding的好用...

0 点赞评论收藏

01-11 04:30

西安交通大学算法工程师

小红书广告算法实习二面

1.实习介绍2.拷打项目3.PLE模型怎么做迭代4.PLE对于门控优化有很多trick，能不能谈谈你的理解5.是否了解最新的特征交叉的工作6.介绍RankMixer（又细又长的过程）7.怎么看待RankMixer的ROI8.评估一下OneRec的ROI和RankMixer的ROI，评估为什么后者更优（这种情况下）9.生成式推荐的ROI问题10.讲一下职业规划11.反问

查看10道真题和解析

0 点赞评论收藏

01-10 05:25

西安交通大学算法工程师

字节大模型算法实习一面

八股 1. Llama的Decoder结构、位置编码有什么改进？2. 三角函数位置编码和ROPE的区别？他们是怎么实现不同的功能？3. 介绍一下RLHF流程，包括哪几步4. llm有哪些评估指标？如何评估模型？5. lora原理细节，为什么可以加速？什么是秩？6. 介绍下Reward model7. dpo训练的损失函数和训练目标8. 不做DPO，只做SFT可以吗？9. Deepseek中SFT冷启动了解吗？手撕10. 给定长度为 n+1 的数组 nums，其中元素取值范围为 [1, n]，求唯一的重复数（力扣287）。11. 手写多头注意力MHA。

查看11道真题和解析

0 点赞评论收藏

01-08 04:25

西安交通大学算法工程师

阿里多模态大模型算法一面-实习

1.问实习项目。2.项目上线前的评价指标？ RAG 子模块的评价指标？3.八股：过拟合原因？有什么常见解决思路？4. 模型训练的显存估计？由哪几部分组成？除了 Model States 之外还有哪些显存占用？·5.造成多模态大模型缓解的原因？现在常见的缓解思路。6·场景题：识别图片并生成商品描述，会怎么做？7.如果这个产品 MLLM 压根没见过，怎么办？8. 手撕：二维矩阵，里面全是0/1，找联通1联通量的数量。

查看8道真题和解析

0 点赞评论收藏

创作者周榜

关注他的用户也关注了：