首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
长征offer路
获赞
65
粉丝
33
关注
1
看过 TA
455
浙江大学
2026
算法工程师
IP属地:浙江
暂未填写个人简介
私信
关注
拉黑
举报
举报
确定要拉黑长征offer路吗?
发布(62)
长征offer路
关注TA,不错过内容更新
关注
昨天 21:35
浙江大学 算法工程师
26实习淘天大模型二面 凉凉
给我面没招了,感觉自己好菜、面试很难,还是要多多练习,感觉自己说不明白业务逻辑1.实习介绍2.了解 Transformer 吗,编码器和解码器的注意力有什么区别3.后来有哪些比较经典的基于 Transformer 的语言模型,Qwen 相比于原始Transformer有哪些结构上的改动4. 了解 RLHF 吗,DPO 和 PPO 有什么区别,Loss 是什么样的,各自的优缺点是什么5.介绍一下 CLIP,还了解什么其他的对比学习方法6.开放题:了解哪些多模态大模型,目前多模态大模型最大的问题是什么7.代码:1143.最长公共子序列
查看7道真题和解析
0
点赞
评论
收藏
分享
昨天 17:42
浙江大学 算法工程师
阶跃星辰大模型算法实习一面
1.实习介绍+项目吟唱2.八股吟唱(部分不记得了)近20分钟2.1 RL相关:1.GAE是什么?2.蒙特卡洛模拟和时序差分估计的区别?3.偏差和方差是什么?4.GRPO的优势值是什么?怎么算?baseline是什么?5.RL训练MoE架构时的问题?怎么改进?问GSPO?6.DeepSpeed框架了解吗?7.Adam的公式是什么?8.Adam一阶矩、二阶矩和梯度更新是怎么算的?2.2 计算机基础:1.指针是什么?2.指针的长度是多少?3.考了一道指针的算法题,关于赋值的。4.BF16和FP16的区别?5.bit和byte的关系6.什么是时间复杂度?7.GPU死锁是什么?8.排序算法的一般的时间复杂度,并举例几个排序算法9.介绍一下快排,什么时候出现最差情况?为什么一般不会出现最差的情况?10.什么是动态规划?举个经典例子
查看36道真题和解析
0
点赞
评论
收藏
分享
昨天 09:20
浙江大学 算法工程师
字节实习大模型一面凉经 43min
1. 实习介绍2. 项目拷打3. 标准RAG有什么问题?4. 了解Agent吗?把RAG做成Agent有什么好处5. 说一下LoRA的原理;LoRA完推理的时候要挂着Adaptor吗?6. 手撕代码:torch写SFT的loss计算代码(注意shift right)面试官对技术了解很深入,问得都是技术细节,感觉比我自己更了解我的项目,给我面没招了...
查看6道真题和解析
0
点赞
评论
收藏
分享
02-04 19:35
浙江大学 算法工程师
美团大模型强化学习一面-实习面经
1.项目八股1.rmsnorm ,和其他的正则化方法有什么不一样2.flashattn3.qwen3技术报告 哪些亮点4.详细介绍一下 mamba5.verl 框架了解多少,用过吗6.llamafactory 框架用过吗7.简述一下几种强化学习算法2.手撕最长公共子串3.反问整个部门有多少张卡洗数据的占比会有多少
查看10道真题和解析
0
点赞
评论
收藏
分享
02-04 09:25
浙江大学 算法工程师
字节校招大模型Agent算法二面
1.介绍下self-attention,计算其时间复杂度。2.为什么要用multi-head attention?3.PPO的clip机制?在线强化学习和离线强化学习有什么区别?RLHF是哪一种?4.为什么要用reference model? 为了解决什么问题?5.如何让多个agent协同工作的?举个具体的协同机制例子。6.如果一个agent误判导致策略冲突,如何处理?7.有没有用到类似AutoGen或LangChain的框架?为什么选这个框架?8.你是怎么设计agent的记忆系统?9.长期记忆如何存储?如果历史记录量非常大,怎么优化查询效率?10.有没有做记忆衰退,避免旧数据干扰新任务?11.你们这种模块堆叠的架构是怎么设计视觉问答模块和动作模块的协同逻辑的?12.human feedback是怎么被agent消化吸收的?有没有用rl进行策略更新?13.有没有做过模型压缩?比如在车载端或低端设备上的推理加速?14.如果量化后理解能力下降怎么办?怎么做精度补偿?15.你怎么处理响应速度与推理精度之间的tradeoff?是先召回再精排,还是单次生成?
查看15道真题和解析
0
点赞
评论
收藏
分享
02-04 02:20
浙江大学 算法工程师
百度文心一言Agent大模型面经
问题1:对比主流大模型(如GPT、BERT、T5)在网络结构、核心机制(编码器-解码器结构、层数配置)上的核心差异,并分析这些技术选择对模型在生成力、理解深度和效率等方面的影响。问题2:大模型训练和推理中常用的位置编码方案有哪些?请分别说明每种编码方式的优势、局限性及适用模型。问题3:拆解大模型自能体(Agent)的工作原理,说明其核心组成部分(感知、记忆、规划、学习模块)及在环境交互和任务执行中的作用。问题4:描述大模型从预训练、微调(指令微调)到推理部署的完整流程,说明每个阶段的核心目标及关键技术。问题5:在项目中的技术改进动机是什么?遇到了哪些痛点?改进后带来了哪些具体收益?如何量化这些收益?问题6:什么是大模型幻觉现象?分析其产生原因及业内有效缓解方法。问题7:大模型生成文本时为何会出现重复内容?列举主流解决方法并分析其他可能原因。问题8:分析当前大模型行业在技术应用、落地中的待解决问题,并提出创新解决思路。问题9:若设计面向办公协同或智能客服的场景化大模型,应从哪些方面入手?说明设计决策的原因。问题10:分析百度文心一言的技术性能、功能体验和应用场景,指出其优势及可改进之处。
查看10道真题和解析
0
点赞
评论
收藏
分享
02-03 20:55
浙江大学 算法工程师
美团大模型算法实习一面
1. 项目细节:SFT数据合成、SFT/RL训练细节、奖励函数设计2. 项目细节:多模态对齐(Text和Image)3. 项目细节:证明Cold-Start SFT后再RL的模型比只RL效果好4. 项目细节:为什么不用DPO、PPO等经典强化学习方法?5. 项目细节:数据覆盖领域及微调保留通用能力的方法6. 算法题:Leetcode大数加法7. 八股:BERT模型结构和原理8. 八股:用BERT做一个分类任务9. 八股:Transformer的多头注意力机制原理10. 八股:Decode-only与Encode-only架构区别及设计原因
查看10道真题和解析
0
点赞
评论
收藏
分享
01-31 15:30
浙江大学 算法工程师
滴滴大模型多模态校招二面
1.介绍简历和项目;2.问了一些项目细节3.对于Agent的了解?对于RAG做了哪些优化?4.对于RL的了解,详细问了PPO的原理?5.问了一些场景题:比如单个LLM能否帮助用户完成行程规划(从出行到酒店,都订好票)?6.问了一些学校的事情,毕设做的啥之类的,为啥转行等问题
查看7道真题和解析
0
点赞
评论
收藏
分享
01-31 10:30
浙江大学 算法工程师
懂车帝推荐算法二面-实习面经
1.项目介绍2.llamfactory和huggingface框架的区别3.模型幻觉怎么处理,为什么会有幻觉4.模型输出的处理,如果输出不是你想要的该怎么办5.栈和堆,c++的智能指针代码:手撕最大堆
查看6道真题和解析
0
点赞
评论
收藏
分享
01-31 00:20
浙江大学 算法工程师
平安科技NLP大模型算法实习一面
项目方面: 1、SFT用的什么模型?如何进行的蒸馏微调?只用数据还是logits蒸馏?2、LLM生成的数据如何直到是对的还是错的?如果没有金标准数据怎么办?3、你觉得这个项目的亮点是什么?4、智能体方面,ReAct架构具体是如何做的?规划智能体和生成SQL有没有交互?有的话如何防止一直迭代不结束?5、如何预防用户使用特定任务智能体干别的?八股方面:八股先问了一个:二叉树的层序遍历用什么数据结构?然后我有点突然懵,面试官就换了一个问题,介绍一个排序算法思想和逻辑,以及时间复杂度是什么。无手撕
查看7道真题和解析
0
点赞
评论
收藏
分享
01-22 16:10
浙江大学 算法工程师
AI coding推荐
目前编程助手cursor,claude,codex,github copilot,Qcoder,antigtavity,gpt,Gemini,Trae,qwen-coder等,大家推荐哪个,他们分别都有什么优缺点
AI coding的好用...
0
点赞
评论
收藏
分享
01-10 22:35
浙江大学 算法工程师
小红书大模型算法实习一面
1️⃣ 实习介绍2️⃣ 拷打 rag 项目:1.项目还可以提升的地方2.感觉自己可以多久完成这个项目3.dpo训练对于系统问答的优化在哪里4.提高模型的准确率核心是什么5.怎么提高数据的质量6.rag 文档怎么切分7.rag 向量化的模型8.rerank 用的什么模型9.有没有微调 rerank 模型/应该怎么微调10.dpo 用的什么库11.代码:已知无序数组,求第 k 大数
查看11道真题和解析
0
点赞
评论
收藏
分享
01-08 11:30
浙江大学 算法工程师
快手广告大模型校招一面
1、实习介绍2、简历项目深挖- 奖励函数设计:reward函数是如何设计的?数据集的配比是怎样的?- 编码树如何构建?为什么使用高斯分布?3、inductive learning和transductive learning有什么区别?4、实习深挖- Viking是什么?相关业务背景是什么?- 冷启动时,不同专家模型特征输入为什么不同- id特征为什么学习效果不好?5、手撕给你整数 delay 和 forget,以及整数 n。每个人在发现秘密后的 delay 天开始,每天可以分享给一个新的人。在发现秘密 forget 天后会忘记秘密,忘记后不再分享。求第 n 天结束时知道秘密的人数。
查看8道真题和解析
0
点赞
评论
收藏
分享
01-07 21:25
浙江大学 算法工程师
美团大模型推荐算法二面-日常实习
1.Qwen3-8B这里为什么使用 base 而不使用 instruct 模型2.topk和 topp 是什么?3.这个项目为什么不用 RL?4.Transformer 降维是怎么做的?的基本结构,并解释自注意5.Transformer 力机制。6.使用的 Embedding 模型结构是什么?输出向量维度是多少?7.代码:分析时间复杂度和空间复杂度。
查看7道真题和解析
0
点赞
评论
收藏
分享
01-07 09:30
浙江大学 算法工程师
蚂蚁多模态大模型算法实习一面
1.项目介绍2.介绍实习3.数据集使用的是公开数据集还在有自己构造数据集4.分别讲-下 Dense 模型和 MoE 模型以及二者的区别5.讲一下MoE的 路由机制是如何做的6.训练完验证使用的是什么数据集7.做这个工作的过程中的难点在哪8.如何做的 SFTQ9.介绍一下 PPO10.讲-下 RAG° 项目11.分类任务常用的评测指标有哪些12.讲-下 LORA° 微调的原理13.A、B 矩阵怎么初始化的14.LORA 微调秩设置的是多少15.算法题:三数之和
0
点赞
评论
收藏
分享
1
2
3
4
5
创作者周榜
更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务