26届校招|快手大模型应用算法面经

▶️一面
🚤时长约50min
1.自我介绍。
2.拷打了一下项目和论文。
3.为什么多头注意力能提升表达能力?
4.为什么要在大模型中使用 RMSNorm ?和 LayerNorm 有什么差异?
5.KV Cache 是怎么起作用的?为什么对长上下文推理很关键?
6.大模型推理时的加速思路?
7.模型微调时遇到过过拟合吗?怎么处理的?
8.✨算法题手撕:
1️⃣字符串的全排列
2️⃣二叉树序列化与反序列化
▶️二面
🚤时长约40min
1.自我介绍,深挖简历。
2.深挖项目,针对项目思路不断追问。
3.大模型生成内容如何做去重过滤?
4.如果词表特别大(10w+ token ), Softmax 加速通常有哪些实现?
5.如果要在中文领域做Instruction Tuning ,需要注意哪些数据问题?
6.LoRA 和 Prompt Tuning 有何区别,分别适于什么场景?
7.反问。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
#算法岗面试# #推荐算法# #我的秋招日记#
全部评论

相关推荐

1.你的 Agent 系统Prompt 是怎么设计和迭代的?有没有做过 Prompt 自动优化?当用户提出不完整的请求时,如何补全用户意图的?2.构建 Agent 的时候,遇到过哪些瓶颈?LangChain 的 memory 默认机制在多3.用户并发中怎么做隔离?你是如何保证线程安全的?4.微调 Llama2 你是怎么选择训练样本的?清洗逻辑是什么?你有没有观察到哪些训练样本质量问题对模型行为有很大影响?举例说明。5.DPO相比 SFT,有哪些优劣?它在 Agent 任务上效果提升明显吗?你怎么构造偏好对?构造逻辑是自动的还是人工?6.你说你服务部署在 vLLM 上,为何选择它?KV-cache 如何帮助推理加速?你自己做过哪些优化?7.假如需要支持 Streaming 输出,但当前服务延迟又超标,你会怎么折中设计?8.多轮对话上下文状态管理是如何做的?如何在高并发场景下保证一致性?9.你做的 Agent 使用了多少个外部工具,在调用链条上如何保障故障容错和超时机制?10.有没有做过工具调用失败后的feedback策略设计?11.训练过程中数据来自用户行为日志,你是如何从这些数据中抽取训练对话的?有没有做过归一化或事件抽象?12.有没有了解过带有时间窗口/偏移限制的对话系统?模型怎么“理解时间”?13.你觉得 Agent 哪些模块最容易在真实业务中出问题?你会如何监控和定位的?
查看13道真题和解析
点赞 评论 收藏
分享
一、背景与项目核实1. 你做 PPT一般会用哪个软件做?(追问:这两者有什么不一样吗?你会用别的软件做辅助吗?如 Sketch/Figma/PS)2. XXX这个项目,持续的时间有多长?你怎么间接贡献?3. 举一个你印象中比较深刻的例子,比如你负责这个产品有多少 SKU?二、数据分析与底层逻辑1. 你持续维护XXXX核心数据监控体系,做这个事情的目标是什么?2. 你们XXXX核心数据有哪些方面?核心指标是什么?(追问:只有 XX成功率这个数据吗?)3. 你们的漏斗分几层?分别的关键动作是什么?那每个漏斗都会有什么样的考虑去这样设置呢?4. 你们XXXX和XXXX中间有多少个环节或者有多少个步骤?(追问:那中间的环节就不看了是对?)5. 你们这个XXXX是要收费的是吧?(核实变现模式)6. 你的转化率提升 X% 是在哪个环节做提升的?如果你的数没有问题的话,你的一些归因要怎么归?7. 你的季度 UV 规模提升了 XXX,转化率提升了 X%,那么你的季度 UV 规模是多少?(追问:你们的 DAU、留存和活跃呢?)三、项目落地方案与方法论1. 核心功能迭代和本地化优化里面,你能举一个跟我们现在在招的岗位比较相关的需求优化的项目案例吗?2. 在这个做的过程中你是怎么做的?有没有遇到问题以及遇到问题了之后怎么解决?最后拿到什么样的成果?3. 你做的XXX项目,其牵引指标和你上线后观测的指标分别是哪些?4. (针对引入XX设计后)整体的通过率是否会变更高?你们有在观测吗?如果做了之后,你的通过率会提高多少?5. 你对 AB 实验有了了解吗?或者是有有做过吗?四、对百度XX AI 业务的理解1. 你之前有用过XX吗?XX的 AI 功能,你有尝试着用一下?2. XX首页有登录进去吗?(好核实对产品首页的熟悉度)相关信息已做模糊处理
产品面经
点赞 评论 收藏
分享
评论
1
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务