算法工程师精选面经合集
11家公司
42篇面经
最新 热门
今天 09:30
门头沟学院 Java
蓝色光标AI应用开发校招面经
查看14道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/0bcbddbf004647fba1505269b78a5bda
字节AI算法 二面 好难啊
发点面经攒攒人品1、你在线上或离线训练时,过拟合怎么处理?直接说你最有效的三个方法和拿到的收益。2、把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同;跟 LN、GN 比,分别什么时候用、怎么取舍。3、分类和回归你最常用哪些损失?你更偏好哪几个,为什么(从鲁棒性、梯度、数值稳定性上谈)。4、L1 和 L2 正则你怎么选?它们各自的效果与风险是什么,工程里你是怎么权衡的。5、二元和多分类的交叉熵你怎么写?在工程里你怎么做数值稳定实现。6、AUC 到底在统计上代表什么?你怎么计算它,在线上业务里你如何解释“这次 AUC 提升”的含义。7、你做 CTR/CVR/CTCVR 联合建模时,ESMM/ESMM2 是怎么推导与工程落地的?线上到底带来了什么收益。8、Transformer 里因果注意力的 Q/K/V 各从哪来?Mask 具体怎么实现。9、Scaled Dot‑Product Attention 为啥要除以 √dk?如果不除会出什么数值或训练问题。10、把 Transformer / Decoder‑only 的整体结构过一遍,各个组件分别在干什么,有哪些常见变体。11、位置编码这条线你怎么选:绝对 PE、相对 PE、RoPE 各自的思路、优势和局限,结合你的项目谈取舍。12、长上下文怎么搞?Rope scaling、Position Interpolation、KV Cache 管理、检索增强、窗口注意力,你的实战方案是什么。13、KV Cache 在训练和推理中的差异是什么?它的加速价值有多大,吞吐与延迟你是如何权衡的,vLLM/paged‑attention 需要注意什么。14、PEFT 方案里(LoRA/QLoRA/Prefix/Prompt‑Tuning/Adapter)你怎么选?说说稳定训练的经验。15、SFT 和对齐(RLHF/DPO/IPO/PPO)原理差在哪?在不同数据与资源条件下,你怎么选路线。16、RAG 系统你怎么设计?切分、索引、召回/重排、压缩/融合、兜底策略怎么串。17、提示词工程你是怎么搞的?System/角色/约束/分步指令怎么写,如何防越狱
查看17道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/00fe7ef30f5a45eb97cf6d96eda6680d/feed/main/detail/65407d13624942d0ace275771b918826/feed/main/detail/e165103c7b6345dd9f73e87389ace6f9/feed/main/detail/d07189aecb5c40b89f5c4c1460d1167f
openjobs-ai一面
点赞 评论 收藏
分享
/feed/main/detail/20805242b6234399ace4971f3ac6c836/feed/main/detail/772e3ae7946540699b6adcb732a9aff9/feed/main/detail/1a1a229b1d9f4a5bbfcb6ea6c9857339/feed/main/detail/78d6c8c30f1741e6b0a1a02d7b4bbfab
字节跳动AI应用开发面经(Tiktok直播方向)
自我介绍以后开始拷问:项目:1,如何做到筛选视频困难样本的(只有这个答得有点曲折,也记不清项目里面是怎么做的了,其他答得还好的都记不清了,后面也知道了这个经历和公司业务内容强相关)八股:A。面试官说先从Python基础问起(问之前还确认了我用C还是用Python):1,Python里面可变对象跟不可变对象的一个区别,及其含义,以及模型训练当中怎么用2,Python里面可变对象包括什么,元组算不算可变对象3,对上一个的follow up:可变对象和不可变对象的本质区别?也即list能不能作为哈希表的key?(可能因为上一个问题答得隔靴搔痒没有切中面试官的心意)4,什么是全局解释器锁GIL,在这种情况下怎么进行多线程编程5,什么情况下会用多进程什么时候会用多线程6,多进程之间做并发的话怎么去做数据共享以及同步互斥(一开始自己回答了Lock,后来面试官提示是多线程之间做的并发,于是端上了Event和Semaphore Quene等)7,了解过Python装饰器的作用吗,在代码里面有没有用过,它的原理是什么8,Python在数据处理当中常见的性能优化手段9,10个T的视频数据浏(浏览数据或者点赞数据),想去统计这些数(每个视频的观看人数和点击人数)。这个东西用Python来写的话,会怎么去写(后续补充:在本地的机上面处理,而不是说用分布式那种那个来处理。10个T还不至于一定要上分布式)B,计网:1,HTTP跟HTTPS区别和联系C,数据库1,了解数据库事务吗,简单讲讲2,LEFT JOIN 和INNER JOIN的区别(但是本人对数据库实在不熟不知道有没有听错问啥……)D,大模型Transformer里面会用那个Flas Attention跟那个Paged Attention去优化,它们的那个区别跟那个原理是什么代码手撕:最长回文子串,不过是直接返回子串面试官看我补全代码以后捉了点bug就没说别的了,问了问时间复杂度以及有没有比动归更好的解法(此外我听过一个说法,说如果面试官直接问你hot100原题就是很想招你进来了,我不清楚)反问环节:1,这个实习岗位具体做什么?业务场景是什么?——主要围绕 TikTok 直播的音视频内容理解与标签体系建设。在连麦、试音等场景下,对内容进行识别后自动打玩法/分类/风格等标签。目标是提升标签质量(准确率/覆盖率等)并推动自动化。工作会包含线上推理服务与工程链路设计,配合策略/算法团队做模型与策略调优2,使用什么模型对数据打标签?开源还是闭源?——同时会做开源与闭源大模型的对比实验,效果好的方案会通过实验与切流获得更多流量。根据内容来看感觉这个应该是加了AI调用和提示词工程的python后端开发,整体更偏工程,也无怪乎大模型这块也就问了这么点btw喜茶的提拉米苏浓巧好喝
查看17道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/241dd9715000479f9a0ec68aca0af819
昨天 15:35
门头沟学院 Java
校招之某生物公司Agent开发面经
查看11道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/8b3f500db34a44a380cb8989feea553d
昨天 14:35
门头沟学院 Java
深圳外企校招Agent开发面经 攒人品
发一下问题给大家参考,攒攒人品!1.你提到自己部署过Deepseek的模型,具体的部署脚本流程你了解吗,还是仅作为执行方?2.你们有自己的GPU吗?3.为什么要自己部署语言模型,API其实并不贵?4.模型参数量对语言模型有什么影响?5.若要使用大参数量模型,如何解决其自由发挥的问题?6.在提示词方面你熟悉吗?通用情况下,如何通过提示词获得更高质量的回答?7.我们岗位要做多样场景的AI工具机器人(如服务器运维巡检、网络巡检、市场分析等AI应用开发),你是否能接受?8.你知道什么是向量数据库吗(结合AI+RAG场景)?9.为什么需要用向量数据库?它解决了传统大模型的什么问题?10.若要做企业知识问答机器人,利用企业内部的Word、PDF文档实现检索增强,你会如何完成这个需求?11.文档存入向量数据库的中间流程是什么?12.你提到的向量化是embedding吗?一般怎么做embedding,你有实践过吗?13.如何判断RAG的召回质量是否符合期望?若不满足,可调整什么参数优化?14.向量相似度度量有哪些计算公式(算法)余弦相似度15.你有没有做过AIAgent(如工具调用相关),可以介绍一下吗16.做意图识别时,如何确保LLM能根据用户输入准确识别要调用的工具?写prompt17,若工具数量较多(如10-20个),每个工具都写描述和示例会让prompt过长,有没有其他解决办法18.若20个工具可分为3-4类,如何设计两层工具调用提升意图识别准确率?
查看18道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/8ee12044e8284a8d8d6140dc2d0840ff/feed/main/detail/c63f8ce6143d4018858bceb33323f834/feed/main/detail/ccc2034c95b3413b8562f805a40e00e9/feed/main/detail/9122da2a82d34a0bb95c135f8af84b53
昨天 11:25
门头沟学院 Java
阿里 Agent开发 一面-校招面经
有面试过同岗的朋友欢迎评论区交流!1.若用户量大幅增长,实习的项目相关系统能否应对,瓶颈是什么?2.你平时会使用大模型处理哪些任务,觉得大模型在哪些任务上处理得好,哪些任务处理得不好?3.你做的另一个项目的核心目标和整体架构是什么?4.你做的另一个项目是生成文档还是生成核心代码?5.你做的另一个项目若工业界落地失败,会如何处理?6.你做的另一个项目在记忆模块设计上有什么思路,如何让相关技能更好地发挥作用?7.你做的另一个项目中,模型是如何选择的,有什么选择依据或方法?8.大模型幻觉问题该如何处理,服务化过程中会产生哪些相关问题?9.你做的另一个项目现在能否在本地运行?10.RAG的优缺点有哪些?11.多任务相关模型有什么适用场景?12.常见的Agent产品有哪些特质?13.若发现项目中模型执行不成功,会如何处理?14.长期记忆相关设计中,关键关注点有哪些?15.从整体设计角度,长期记忆相关功能会从哪些角度考量?16.长期记忆相关设计还有哪些可优化的点?17.Agent领域的发展趋势是什么?18.若代码生成成本越来越低,工程师的核心竞争力会发生什么变化?19.平时会通过哪些渠道关注AI技术动态?20.最近有没有遇到让你觉得印象深刻的AI应用,其情节或功能有较大亮点?21.进入项目后遇到新的工具技术,会如何评价技术是否能解决问题?
查看21道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/07cdc6940fa94a1d99c24762c56b2b05
网易 llm算法一面凉经 面没招了
整体面试还是不错的,但是没后续了,不知道是哪里出了问题1.项目拷打2.你做的日志解析分析项目里涉及爬虫,具体是做什么的?你有相关的爬虫经验吗?3.用一两句话说明你的爬虫能力深度,以及处理过的最复杂的问题是什么样的?有处理过登录验证码、APP相关的反爬场景吗?4.你做的意图识别项目,描述一下面临的问题、产品需求,过程中遇到的技术难点以及解决方法。5.普通策略下意图识别准确率已经达到95%,经过优化后达到了多少?具体做了什么工作让准确率提升的?6.举例说明意图识别项目的业务场景,包括用户的提问方式、模型的解答形式,以及意图类别的设计逻辑。7.意图识别模型的类别除了商品查询、21类操作手册查询,还有别的吗?遇到无关问题时,模型会归类到哪一类,如何处理?8.提升的3%准确率,是不是主要通过完善数据集实现的?如果要进一步提升准确率,你的思路是什么?9.这个实习的项目中你是主导还是配合角色?这些优化思路是领导给的还是自己提出的?10.你做过的所有项目里,有哪些是自己主导的、有成就感的事情?11.你做的编程助手项目借鉴的是哪个开源框架?除了这个框架,还有没有对其他开源框架做过选型工作?12.你看过这个开源框架的完整代码吗?你觉得它的本质是什么?有了解过检索增强、总结洞察相关的内容吗?13.除了这个编程助手项目,还有其他比较有成就感的事情吗?14.谈谈你对Transformer架构中注意力机制的理解,以及它的实现方式。15.讲讲Transformer架构中编码器和解码器的处理过程,以及两者的区别。
查看14道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/86a34c561e5946abb064c20cd66dc64f/feed/main/detail/f010fb598e6d45e8b97e0549be43db57
百度 LLM算法 校招二面 强度拉满了
发一下问题给大家参考,攒人品中。。。1.实习中多智能体系统包含几个智能体?它们之间如何交互?2.实习中意图识别模型需要识别多少个意图?3.750B模型用于什么场景?4.实习中Qwen3VL模型是多少B的?用于什么场景?5.在实习中,你主要的贡献是什么?6.检索环节做了哪些优化?7.答案生成环节做了哪些优化?8.是否做了SFT或强化学习相关工作?在哪个环节做的?9.SFT过程中是否对类别标签做了清洗或修正?10.强化学习的样本量是多少?11.基础模型经常分类分不准的案例有哪些?12.在校项目中,为什么用对话数据来增强数据集?13.在校项目任务的输出可以简单描述并举例吗?14.单智能体能否完成相在校项目关工作?为什么要智能体?15.LangGraph相对其他开源智能体编排工具的优点是什么?16.在现有场景中是否需要用到LangGraph的状态管理功能?17.如何理解Long-termMemory的实现方式?18.若将电商场景中用户的购买、点击、兴趣等信息设计为长期记忆,有什么想法?19.Context Window能否储存大量电商交互信息?如何解决存储问题?20.推理时若将大量Memory以Token形式给到大模型,Token长度过长该如何处理?21.强化学习有哪些常用技巧?22.若通过SFT进一步提升模型准确率,常用的手段有哪些?23.SFT的理想数据量是多少?如何确定?24.SFT数据分布一般怎么取?为什么选择该分布而非其他分布?
查看24道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/29fa0059d41c486090487bc9448c3f10
昨天 08:25
门头沟学院 Java
阿里 Agent开发一面 凉经-校招版
给我面没招了,强度也太大了....1.实习拷打2.项目拷打3.处理查询文档里的异构数据(如图片)时,具体的处理流程是什么?解析成纯文字后如何进一步加工?这样只返回文字给用户,图片信息不会丢失吗?4.你们是通过人工打标建立图片和文本的对应关系吗?文档量很大的情况下,打标工作能完成吗?5.如何保证大部分图片异构数据解析后回答的正确性?若回答错误,怎么识别问题?后续要验证回答准确性,你有什么方案?6.用于评测的另一个大模型,如何构造问题、分析文字并进行对比?这个大模型的正确率以及模型自我一致性怎么确定?7.你们的模型基于哪些异构图像做增强?模型会不会产生幻觉,生成文档外的内容?8.若用户的问题不在文档里,你们会怎么处理?是调用其他模型吗?大模型回答不了时,会提示用户补充问题吗?用户补充后仍无法解决该怎么办?模型如何判断何时需要让用户补充提问?9.你们有框架编排这些流程吗?用的是什么框架?10.怎么理解检索召回率?这些指标具体包含哪些评价项?什么是忠实度?召回率的分子分母是怎么定义的?11.你之前那段实习的具体工作内容是什么?针对设备故障叙述报告这类复杂文本,模型如何理解?是做了相关检测吗?大模型是怎么实现术语解释的?12.请讲一下LoRA技术,除了减少参数量,它还有什么优点?你做的LoRA相关工作,后续有落地应用吗?13.你写代码主要用Python吗?会不会用Java?了解Java的多线程、双亲委派模型以及消息中间件吗?有没有做过Java相关项目?14.你用过LangChain吗?如何用它解决大模型的幻觉问题?若不熟悉LangChain,还能通过什么方法做AI能力增强?
查看12道真题和解析
点赞 评论 收藏
分享
/feed/main/detail/79bb100d34fb45c8a2c2d395561e028b
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务