算法工程师精选面经合集
11家公司
43篇面经
最新 热门
/feed/main/detail/70e337e4af2a4dd3ab8ca34fe190cc5a/feed/main/detail/e7d59a9cf0534dd5ae296f081974fdb0/feed/main/detail/692a9b236f8645f7ab06f01d087fc3bb
淘天大模型算法一面-秋招面经
1. 实习介绍2. 挑一个你最熟悉的大模型项目,讲讲它的目标,你主要负责什么,以及你觉得最有意思的技术点。3. 在Transformer的Decoder里,我们为什么需要用Mask把未来的信息“遮住”?从代码实现上讲,这个Mask具体是怎么作用在Self-Attention分数上的?4. 关于LayerNorm放在残差连接的“前面”还是“后面”(Pre-LN vs Post-LN),社区里有很多讨论。这两种设计选择,主要会影响训练过程的哪些方面?你更倾向于哪一种,为什么?5. 我们要在线上部署一个大模型提供服务,推理速度和吞吐量是个大问题。像vLLM这样的工具,它主要是通过什么核心思想(比如PagedAttention)来解决KV Cache的内存问题,从而提升推理效率的?6. 我们有一个基础模型,但它不太会“听人话”。如果想把它训练成一个能很好遵循指令的聊天助手,通常有几步?能简单说说SFT(监督微调)和基于人类反馈的对齐(比如PPO/DPO)分别是在解决什么问题吗?7. 假设我们有一个效果很好的70B大模型,但因为太大太慢,没法直接上线。现在需要你把它“变小变快”。你会考虑用哪些方法(比如剪枝、量化)?各自有什么优缺点?8. 相比于让大模型直接回答问题,现在很流行的RAG(检索增强生成)方案,它最大的好处是什么?主要解决了什么痛点?9. 我们的RAG系统上线后,发现有时候还是会“胡说八道”,或者答非所问。如果让你去排查,你会从哪些方面入手?(比如是检索模块没找对,还是生成模块没理解好?)10. 核心代码模式算法题:二叉树的中序遍历11. 反问
查看9道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/9cca6de192b9483abe21ef6537d3824a/feed/main/detail/e24347cd7de34d0fa9beb0393118790c/feed/main/detail/9cdb0345ada3435fa878f5931b581b2c
美团大模型算法二面-秋招面经
查看15道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/e72d861f57c1499393be6651f8611177/feed/main/detail/816b4b5d959f4df3ad6664e78b6593ee/feed/main/detail/1706a63a81354ae382c739055523a2e5/feed/main/detail/a53f7b06cde74bcbbfe6dbfd4a444db7/feed/main/detail/9caba1d3723d489995545b7e63a7d421/feed/main/detail/a2b78b9b31b74a00aecc345a781fcb9e
26校招 快手大模型算法 二面
1.你这个xx实习的项目能展开讲讲吗?你主要负责哪块?为什么是你来做这块?2.自动化评估体系这里能具体说说怎么评的吗?哪些维度3. 多维度自动化评估体系,那每一个维度是怎么做的?比如你说的关键词匹配和问答对,这个流程怎么构建的4.图表的准确性你怎么评估的?怎么从markdown和HTML 里提取对应图表并比对的?有没有一些异常case举个例子?5.用了playwright去截图,那遇到报错或者渲染失败怎么办6不同设备模块比如交换机、服务器,它们的字段特征都不一样,那你怎么做统一化训练7.那你这个知识图谱底层是用什么数据结构存的8.用的是PAI吗?那有没有对比过比如说 igraph或者图数据库像GraphScope这些之间有啥区别9有没有用过一些大模型的推理?比如说用千问做辅助根因预测10你们这套系统的准确率和召回率大概是多少,那比如说没有到90%,你们是认为这个指标是OK的吗11所以它是系统推理出根因之后还需要人工check,然后才能执行故障预案,有没有哪一部分流程是完全自动化的12你们平台现在接的主要是底层设备指标,那有没有接入一些业务指标,比如订单失败率转化率这类的业务数据13我有个疑问就接入业务指标的话你需要知道整个平台的服务拓扑,那你们这个平台是怎么接入业务侧拓扑的?是自己做的吗?还是中台团队负责15.那你既然用过图数据库,你知道它底层的存储结构是怎样的吗?比如它是怎么组织边和节点的16.我们现在是两阶段推荐架构:第一阶段召回用的是embedding点积召回,第二阶段是MLP跟transformer做多目标打分。那你觉得在我们这么大规模的数据量下,如果要做real-time re-ranking,你会在架构上怎么做trade-off?怎么压低latency17.我们现在在做embedding精度提升也试过加cross tower、attention pooling 甚至meta learning,但发现一旦模型重了,就难以部署到线上实时系统。那你觉得在embedding learning的这个模块里,有哪些方案能在不严重影响线上性能的情况下提升语义表示能力
查看16道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/334bb6921fae45c1ab5810aea9445caf/feed/main/detail/1d3b190298004eeeb1cbe18143dd8e6c/feed/main/detail/852091c46fcb49e0b2c3f58e70adae69/feed/main/detail/af3b985e7de544be99d4442d0bd10189
蚂蚁大模型Agent算法二面-55min
1.你的 Agent 系统Prompt 是怎么设计和迭代的?有没有做过 Prompt 自动优化?当用户提出不完整的请求时,如何补全用户意图的?2.构建 Agent 的时候,遇到过哪些瓶颈?LangChain 的 memory 默认机制在多3.用户并发中怎么做隔离?你是如何保证线程安全的?4.微调 Llama2 你是怎么选择训练样本的?清洗逻辑是什么?你有没有观察到哪些训练样本质量问题对模型行为有很大影响?举例说明。5.DPO相比 SFT,有哪些优劣?它在 Agent 任务上效果提升明显吗?你怎么构造偏好对?构造逻辑是自动的还是人工?6.你说你服务部署在 vLLM 上,为何选择它?KV-cache 如何帮助推理加速?你自己做过哪些优化?7.假如需要支持 Streaming 输出,但当前服务延迟又超标,你会怎么折中设计?8.多轮对话上下文状态管理是如何做的?如何在高并发场景下保证一致性?9.你做的 Agent 使用了多少个外部工具,在调用链条上如何保障故障容错和超时机制?10.有没有做过工具调用失败后的feedback策略设计?11.训练过程中数据来自用户行为日志,你是如何从这些数据中抽取训练对话的?有没有做过归一化或事件抽象?12.有没有了解过带有时间窗口/偏移限制的对话系统?模型怎么“理解时间”?13.你觉得 Agent 哪些模块最容易在真实业务中出问题?你会如何监控和定位的?
点赞 评论 收藏
分享
/feed/main/detail/c855c639cd2e48cda09ec208f6e2cbe6/feed/main/detail/833336bbbccb4c4181f834f2cc5710eb
昨天 22:17
武汉大学 Java
20251217【华为】AI岗笔试算法真题(共2题)
题目1:使用线性回归预测手机售价题目2:模型量化最小误差
投递华为HUAWEI等公司9个岗位
点赞 评论 收藏
分享
/discuss/830929692810084352/feed/main/detail/374da084a8104774934c0bdf4043d76f
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务