27实习字节大模型算法 二面 45min

1、实习介绍
2、讲述论文内容和细节
3、是否了解过多模态大模型,简单讲一下了解的多模态大模型
4、dpo 和sft 的区别,可以先dpo后sft吗?
5、如何处理reward hacking?
6、dpo如果应用在第一轮对话中应该怎样做你会如何构造这个数据集合?
7、手撕hot100:二叉树的右视图
全部评论

相关推荐

03-04 20:00
门头沟学院 Java
如题,官网流程还没开,有意向私信看简历,岗位开放立马进流程。欢迎大家戳呀。贴一个jd2. 手把手,快成长:由资深技术专家一对一指导。你将完整经历从需求分析、方案设计到代码落地的全过程,掌握大模型应用开发的核心技能,快速完成从学生到工程师的蜕变。3. 高机会,留用优:团队对实习生重视度高,表现优秀者可直接获得正式录用Offer。这里不仅有前沿的技术探索,更有清晰的职业发展路径【岗位职责】4. AI 应用功能开发:参与电商运营系统的智能化改造。利用大模型能力,开发自动化的智能任务,帮助业务提效。5. 智能助手设计与实现:面向内部运营人员和外部商家,开发能“听懂指令、自主干活”的AI 助手。让它不仅能回答问题,还能主动提醒进度、生成报告,甚至协助完成跨系统的操作。6. 多智能体协作探索:尝试让多个 AI 角色协同工作,通过合理的逻辑编排,让它们配合完成更长、更复杂的业务目标。7. 工具链与效率提升:参与部门内部的 AI 开发工具建设,封装常用的业务接口供 AI 调用,并探索如何利用 AI 辅助编程,提升团队整体的开发效率。【岗位要求】8. 基础良好:2027 届本科及以上学历,计算机相关专业;熟练掌握 Python/Java/Go/C++ 中至少一门语言,数据结构与算法基础扎实。9. 热爱 AI:对大模型技术应用有强烈好奇心,平时关注 AI 领域动态。善于思考如何用新技术解决实际问题,具备良好的逻辑思维和沟通能力。10. 技术上手快:-- 了解 Agent(智能体)的基本概念,知道什么是工作流编排、ReAct 模式或多智能体协作。-- 接触过主流开发框架(如 LangChain 等),或对向量数据库、Embedding 技术有初步了解。11. 工程实践能力:-- 理解 Prompt(提示词)编写技巧,了解 RAG(检索增强生成)、工具调用(Tool Calling)等基本原理。-- 有过 API 接口对接经验,能将后端服务转化为 AI 可调用的工具者优先。12. 加分项:-- 有 PyTorch/TensorFlow 使用经验,或尝试过模型微调。-- 做过课程设计、毕业设计或个人项目,且涉及复杂业务流程处理(如电商、ERP、办公自动化等)13. 善用工具:习惯使用 Cursor、Copilot 等 AI 编程助手辅助写代码,追求高效开发。招聘对象2026 年 11 月 1 日至 2027 年 10 月 31 日期间毕业的海内外应届毕业生。
点赞 评论 收藏
分享
祝大家都能拿到满意的Offer!1. 项目拷打2. 详细阐述Transformer的底层原理,并说明其能够替代RNN的核心优势;结合Transformer架构的成熟度,分析Self-Attention机制在多模态对齐任务中是否存在瓶颈,以及在实际业务场景中,是否出现过注意力权重完全偏移的情况。3. 讲解LoRA的技术原理,说明LoRA是否仅能嵌入Linear层;分析LoRA无法在LayerNorm层之后插入的原因,以及该操作会对模型训练稳定性产生哪些具体影响。4. 结合实操经验,说明QLoRA降低训练资源成本的核心逻辑;列举常见的模型量化方式,并解释QLoRA选择NF4与FP16组合而非其他方案的原因,阐述NF4的分布拟合逻辑。5. 针对采用multi-query attention优化后,decoder延迟仍居高不下的问题,分析潜在性能瓶颈;探讨vLLM自带的KV Cache是否会成为推理过程中的负担。6. 分别说明Embedding模型与Rerank模型处理文本语料的核心流程,并结合实际应用场景举例说明。7. 结合过往RAG项目经验,讲解从数据清洗到检索服务上线的完整链路搭建流程,重点说明chunk切分的具体策略。8. 分析当前RAG技术落地的最大瓶颈,并阐述你在项目中采取过哪些优化手段来提升检索召回率(Recall)。9. 针对XX领域大模型的训练工作,说明SFT(监督微调)数据集的构造方法与核心思路。10. 结合LoRA微调实操经历,说明rank值的选择依据;在合并adapter权重的过程中,是否遇到过梯度爆炸问题,以及对应的解决方法。11. 结合你的模型部署相关经验,说明模型参数量与硬件算力需求之间的对应关系(例如不同参数量级模型所需的算力配置标准);以部署一个稀疏率千分之三的235B参数量MOE架构模型为例,估算其所需的算力规模。12. 在搭建RAG知识库时,若需对文档进行动态更新,你采用的是全量嵌入还是增量处理方案?若为增量处理,如何规避新旧文档数据分布不一致导致的检索偏差问题。13. 针对机械臂动作态融合相关工作,说明数据融合的具体实现方案,以及对比实验的设计思路与评估指标。
查看12道真题和解析
点赞 评论 收藏
分享
评论
2
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务