w3b - 个人主页动态 - 牛客网

03-23 19:05

门头沟学院推荐算法

推荐算法实习二面-字节拷打麻了

被横向挂了，希望发出来对大家有帮助！1. 项目拷打2. 什么情况下，MAP的损失函数可以用NMSE来计算？（高斯噪声）3. 手写Multi-head Attention4. Attention的复杂度是多少？5. AUC是什么？6. 推荐算法了解哪些？7. 协同过滤的概念是什么？8. 如果是一种普适性很强的物品（如：新华字典），怎么设计指标对它降权？9. AUC怎么推广到非二分类问题？怎么快速计算AUC？10. bn训练阶段和测试阶段区别，详细讲讲原理

查看10道真题和解析

0 点赞评论收藏

分享

03-19 04:30

门头沟学院推荐算法

字节agent开发一面实习面经

发一下问题给大家参考，攒攒人品！1.你了解哪些agent开发的框架？框架里有哪些组件呢？2.memory是什么了解吗？3.上下文窗口满了如果需要压缩，怎么去压缩呢？如何筛选有效信息和垃圾信息，保证正确率最大呢？4.RAG的流程是什么？有哪几种方式实现？5.除了RAG你在项目中还用到了哪些Agent相关的技术？6.MCP了解吗？用过吗？底层是如何实现的？7.Skill了解吗？用过吗？底层是如何实现的？比如渐进式披露是怎么实现的原理是什么？8.FastApi常用的包都了解吗？9.OpenClaw用过吗？你觉得他的核心亮点是什么？10.A2A协议知道吗？11.项目拷打12.手撕：螺旋矩阵

查看12道真题和解析

0 点赞评论收藏

分享

03-15 01:30

门头沟学院推荐算法

字节实习番茄大模型推荐算法面经

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.为什么要使用HSTU,它相较于其他推荐模型有什么优势?2. 介绍一下双塔模型？3. 训练双塔模型时，怎么处理正负样本不均衡。欠采样的方法有哪些？4. 介绍一下常用于推荐的序列模型？5. Transfomer能用来作为序列模型吗？ 但是为什么transfomer不常用于精排呢？6. Transformer和din的参数差异，计算复杂度的区别？7. 介绍一下传统序列模型和transformer的区别？8. Transformer用的归一化函数？为什么语言模型不能使用batch norm？Batch norm和Layer norm的区别是什么？9.有哪些位置编码，各有什么优劣，rope相较于正余弦的优势在哪里，都不需要参数?10.讲一下rope的原理，和公式，rope为什么广泛应用于大模型，但在推荐场景很少用,为什么?11.为什么你使用的HSTU中要加入高效注意力机制?还了解其他的高效注意力机制吗?12.延长序列长度就一定会有效果上的提升吗?最终效果提升了多少?13. 为什么deepseekv3，训练的很快，推理的很快？它用了怎样的量化？MOE，并行手法？14. 还有哪些优化的注意力机制方法，它们的原理是什么？15. 还有哪些加速模型训练的方法？16. 为什么要优化KV-cache？

查看16道真题和解析

0 点赞评论收藏

分享

03-11 06:15

门头沟学院推荐算法

大模型算法实习面经-字节

被横向挂了，希望发出来对大家有帮助！1.项目提问2.聚类怎么实现?3.层次聚类和DBSCAN有什么区别?你用了什么停止准则?4.解释TD35.为什么不用PPO而用TD3?6.TD3为啥输出的是确定性策略，里面的actor不也是概率的吗?7.大模型里的RL了解过吗?8.相对和绝对位置编码有哪些?相对位置编码的优势?9.能外推的相对位置编码有什么?10.Normalization有哪些?11.NLP任务里为什么用LN不用BN?12.BN适用于哪里?为什么?Python基础:1.运算符是干嘛的2.kwargs和*args什么区别3.Print(*args)输出什么4.进程，线程，协程5.Async6.@是什么?pytorch里具体怎么实现的?7.装饰器的原理手撕:最长公共子数组，用O(n)方法实现

查看20道真题和解析

0 点赞评论收藏

分享

03-07 04:25

门头沟学院推荐算法

阿里大模型校招面经俺不中咧...

继续来分享下之前的面经~欢迎友好讨论，信息共享1.什么是大语言模型的涌现能力？目前对该现象的研究有哪些发现？2.什么是 Embedding？词嵌入和句嵌入有何不同？3.大语言模型中的 Tokenization 是如何工作的？不同模型的分词算法有何差异？4.简述大语言模型中的 Prompt Engineering 技巧，如何设计有效的提示词提升模型输出质量？5.对比 Zero-Shot、Few-Shot 和 In-Context Learning，它们在大语言模型中的应用场景和局限性分别是什么？6.什么是 LoRA？它在大语言模型微调中的优势和原理是什么？7.大语言模型的 RLHF 训练流程是什么？它存在哪些潜在风险？8.介绍一下大语言模型中的知识蒸馏，它如何用于压缩模型体积？9.DeepSeek 优化了哪些？为什么不用 PPO，而是用 GRPO？10.对比大语言模型的增量推理和传统推理方式，增量推理的优势和实现难点是什么？11.大语言模型在推理时出现幻觉现象的原因是什么？有哪些缓解方法？12.大语言模型的长文本处理能力有限，目前有哪些技术可以缓解这一问题？13.什么是大语言模型的上下文窗口？扩展上下文窗口对模型性能有何影响？14.目前多模态大语言模型是如何融合文本与图像信息的？15.如何评估大语言模型的性能？常见的评测指标和基准数据集有哪些？16.单个 LLM 能否帮助用户完成完整行程规划，比如从出行到酒店都订好票？

0 点赞评论收藏

分享

2025-10-28 19:26

门头沟学院推荐算法

得物视觉算法一面

1.时长：18分钟2.流程：（1）自我介绍（2）简单问了问项目，面试官比较看重你能不能把项目要做什么？怎么做？为什么做？讲清楚（3）八股：了不了解大模型？chatgpt的模型架构？（3）反问：多模态、AIGC岗位都有，有项目经验最好。算是中台部门，后续2-3轮技术面。ps：无手撕。

查看4道真题和解析

0 点赞评论收藏

分享

2025-10-26 15:59

门头沟学院推荐算法

滴滴工作体验

1、桔厂卷吗？互联网就没有不卷的，但是业务部门不同，卷的程度也不同，一些相对成熟的部门，卷的程度相对没那么重。所以大家如果接到桔厂的offer可以先了解一下对应的部门是否比较成熟？（成立的时间）2、考核kpi会不会很重？不同职级对应的考核kpi会有所不同。职级越高考核的kpi就会越高，能者多劳嘛dddd。而且桔厂的话kpi并不是固定的，每个季度都会根据大盘方向变化。所以接到桔厂offer的uu们，hr跟你说的kpi也未必是长期固定不变的3、氛围如何？目前我还是挺喜欢桔厂的内部氛围的。大家有一定的边界感（下班/周末一般都不会互相打扰），中午会一起吃饭，氛围还是比较轻松，没有特别官僚的职场风气，哪怕上下级之间也很平等。4、加班严重吗？具体看部门，拿我们市场岗位来说，不同地区都会有所不一样。我认为跟个人的工作效率挂勾，因为桔厂里基本每个人都是身兼多职，基本工作时间工作量都是比较饱和，项目线也很多，非常考验个人对于任务优先级的排序、时间管理能力。5、上下班时间？滴滴内部基本都是早10晚7，不打卡，全靠自觉如果工作任务比较多的话，基本大家都会自动自觉留下来加班的hh，所以也是跟个人效率挂勾。

滴滴公司氛围 1959人发布

0 点赞评论收藏

分享

2025-09-24 22:40

门头沟学院推荐算法

滴滴算法工程师一面

流程：自我介绍--拷问项目--手撕代码八股文（其实都很简单）：结合简历提问1、Yolo算法＋SAM算法：可以了解Yolo各类版本改进以及深入了解一个Yolo算法。2、DF模型训练过程、各类调度器等手撕代码：因式分解（递归秒掉）访问：业务、面试轮次（2＋1）

查看4道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务