26秋招字节大模型Agent一面

1.请介绍 Transformer 的结构组成及各部分作用
2.如何降低 Transformer 的计算复杂度?常见的稀疏注意力变体有哪些?
3.LoRA微调的原理是什么?秩 r 的选择会对模型表现产生什么影响?
4.kv cache是什么?为什么能极大地提升推理速度?
5.RAG的完整流程,构建向量检索库时如何处理时间衰减对召回的影响?
6.微调时的训练数据是怎么构建的?如何保证样本多样性和质量?
7.在 RAG+知识图谱的 Agent 系统中,知识图谱更新的机制是怎样的?是怎样保证实时性的?
8.训练 LoRA 模型时,你是如何选择冻结层的?依据是什么?
9.在高并发查询 Agent 系统中,你会如何优化召回和生成阶段的延迟?
10.大规模 Agent 系统在多线程/多进程场景下的资源调度策略如何设计?
11.如果你要在 GPU 资源有限的条件下同时提供推理和微调服务,如何做资源分配和任务调度以保证时延和吞吐?
12.代码:lc15 三数之和
全部评论
请问佬有论文吗? 感觉今年秋招面试机会多吗?俺也准备走大模型/应用
点赞 回复 分享
发布于 2025-11-30 13:11 辽宁

相关推荐

大模型浪潮下,不少26届同学想进军算法岗,却对岗位门槛、工作内容存在信息差。结合大半年实习经验,为大家揭秘真实行业情况,助力暑期与秋招规划。1️⃣大模型核心岗位划分大模型岗位主要分为两大方向:1. 大模型基座:涵盖数据、预训练、微调、对齐、训练/推理架构等工作。2. 大模型应用:包括数据、续训练、微调、对齐、推理部署、Agent、RAG等落地相关研发。2️⃣大模型岗位真实门槛很多人误以为无论文就无缘大模型,实际并非如此,实习与垂直经历比单纯论文更关键。1.基座岗位:学历要求高,基本为本硕双985,或国科大、北邮等强校,部分组要求博士;论文为硬性条件,至少1篇顶会起步,且方向需高度匹配;实习建议两段以上,优先阿里通义、字节豆包、百度文心、DeepSeek等头部机构。2.应用岗位:学历以本硕211及以上为主,是硕士主力赛道;论文非必需,仅为加分项,冲刺高薪计划可补充;更看重实习垂直性,无论文但项目对口,同样能拿到高薪offer。整体而言,求职时经历垂直匹配 > 含金量高低,弱相关经历加分十分有限。3️⃣大厂大模型工程师在做什么 大厂大模型工作并非大众想象中整日训模型、写代码,大量时间用于数据处理、评测与沟通。基座组多做小幅度结构优化与实验;应用组99%工作基于开源模型做续训、微调,搭建RAG、Agent系统,核心是调参、优化数据配比、制定自动化评估方案,最终目标是业务落地,能提升线上指标的方案才是有效方案。 想入局大模型,不必被论文门槛吓退,找准方向、深耕垂直项目,才是突围关键。如果找不到学习方向,需要辅导请私信联系。
点赞 评论 收藏
分享
评论
1
14
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务