03-19 01:35 浙江大学算法工程师

关注

字节日常实习-大模型一面-攒人品

继续来分享下之前的面经~欢迎友好讨论，信息共享
1. dpo 和 sft 的区别，先 dpo 后 sft 可以么
2. 如果把 DPO 用在“第一轮对话”，你会怎么做数据集？prompt、chosen/rejected 你打算怎么来
3. 多轮对话的数据分布你会怎么设计：单轮和多轮各占多少，为什么这么配
4. 具体到 DPO 数据，多轮样本你会怎么采样/怎么配比（有没有什么坑）
5. reward hacking 你怎么看？一般怎么防，怎么兜底

全部评论

推荐最新楼层

04-19 22:06

杭州电子科技大学大数据开发工程师

这个问题我问过几个正在做Agent的朋友，综合他们的回答整理了下。

基础得先打牢。LLM的基本原理要懂，不需要能训练模型，但得知道prompt怎么写、上下文窗口是怎么回事、为什么模型会幻觉。这些是地基，地基不稳上面全是空中楼阁。然后是框架。LangChain和LlamaIndex是目前用得最多的，几乎每个Agent项目都绕不开。但别只会调API，得理解它们的设计思路，比如chain是怎么串联的、memory是怎么管理的、tool calling是怎么实现的。RAG是必学项。Agent大量依赖外部知识库，向量数据库至少要会用一个，embedding是怎么回事要清楚，检索策略怎么优化要有概念。工程能力别忽视。Agent本质上还是个软件系统，API设计、异步处理、错...

想从事Agent应该学习...

点赞评论收藏

分享

04-11 12:00

门头沟学院算法工程师

字节推荐算法日常实习一面 55min

攒攒人品！有面试过同岗的朋友欢迎评论区交流1.实习拷打2.项目介绍3.多任务模型为什么没有使用过ESMM？4.全量更新是怎么做的？增量更新是怎么做的？5.线上线下的验证指标都有哪些？6.多任务模型一般有哪些多任务7.特征优选是怎么做的？为什么要这么做？你还知道哪些特征相关性的分析方法？8.数据样本的比例是多少？9.讲讲PLE模型的架构，细节到每一层的输出都有哪些组成，维度是多少？八股1.讲讲transformer架构2.讲讲Lora，QLora微调的原理？还知道哪些大模型训练的框架3.了解过RLHF吗？4.有没有做过Agent，Agent一般是怎么做的？有哪些流程？5.讲讲ROPE，绝对位置编码和cos，sin相对位置编码的区别？你还知道哪些其他的位置编码？

查看13道真题和解析

点赞评论收藏

分享

04-12 12:03

广西大学算法工程师

腾讯 AI应用开发一面

1. 做一下自我介绍2. 讲一下你做的这个平台，重点说难点 解决了什么问题这个项目的核心不是“把文档喂给模型”，而是先把不同来源的材料转成可稳定检索、可引用、可更新的知识单元。整体架构一般包括文档接入、格式解析、结构抽取、分块与向量化、倒排索引、重排服务、回答生成和引用回填。我负责的部分主要是 chunk pipeline、索引写入和查询编排。难点主要在复杂文档结构，比如目录、页眉页脚、跨页表格、附件引用和条款层级，如果直接按长度切块，召回会很乱，模型也很容易把不同证据拼错。 def build_index(doc): blocks = parse_document(doc) chunks =...

腾讯一面2290人在聊

点赞评论收藏

分享

04-12 21:45

门头沟学院 Java

27字节AI后台开发日常实习一面

感觉面完人都通透了，还是太菜了，下去沉淀一下1.可以挑一个最近觉得挑战比较大的项目展开介绍一下吗？2.Agent内部具体的实现可以再详细介绍一下吗？3.MCP是把自然语言转成预置查询类的工具吗？4.操作内部平台时，工具会去操作吗？5.系统测试完成后，准确率怎么评估？6.用20%数据作为测试集，是模型跑case后人工评判准确率吗？7.如何对答案进行轨迹级评分？8.目前系统的准确率是多少？9.项目后续继续优化的话，有哪些优化思路？10.现在系统最核心的问题是并发问题吗？11.准确率还有提升空间吗？12.模型输出不符合预期时，prompt会有问题吗？会调prompt吗？13.有考虑过做SFT和强化学习吗？14.目前RAG具体的实现是怎么样的？15.如果用Redis的缓存，会在哪个阶段去做？16.Redis为什么在高并发情况下表现得比较好？17.什么场景下会用多线程？18.RAG作为知识库检索，和把知识库放到ES上让模型调用MCP接口有什么区别？19.若自己实现包含ES检索和向量检索的搜索接口，和RAG有什么区别？20.Redis和MySQL在使用场景上有哪些区别？21.B+树是怎么样的结构？22.B+树和红黑树的区别是什么？MySQL用红黑树效率会更好吗？23.1000万条数据用B+树存储，树的高度大概是多少？24.场景题，给定一个实时输入流（随时可能停，无法全量存储），如何等概率选取5条记录？25.手撕：两个有序数组，O（logN）求合并后第k大的数

查看25道真题和解析

点赞评论收藏

分享

04-15 23:30

已编辑

广东工业大学 Java

字节日常实习一面

1. 大二有时间出来实习吗？第一个项目（知识分享平台）相关问题1. 分享平台做了多久？几个人做的？2. 定制化的二进制检测技术（SDS）可以具体介绍一下吗？3. 位图（Bitmap）是怎么设计的？4. 为什么使用位图记录用户点赞行为？5. 用户增长后，位图该如何处理？6. 用户如何通过ID找到位图中对应的位？7. 用户ID取模后冲突了该怎么办？8. SDS是用来做什么的？9. 什么时候会触发SDS的更新？10. 定时任务怎么扫、扫什么范围来更新SDS？11. 为什么选择使用binlog来做事件发布？有别的方案吗？12. 点赞系统中的卡夫卡（Kafka）是用来干啥的？和binlog的链路关系是什么？13. 用户频繁点赞再取消，链路会一直发消息，如何确保消息的有序性？14. 灾难回放是什么时候触发的？15. 自定义的热key探测机制可以具体介绍一下吗？16. 怎么样识别哪一篇内容/哪些信息是经常被访问的？17. 如何确保存储和缓存之间的一致性？第二个项目（agent相关）相关问题1. 计划执行校验迭代的机制是怎么实现的？2. 中间的上下文是怎么样共享的？3. 上下文太长了该怎么办？4. 引入的RAG具体引入了一些什么样的信息？5. RAG的准确性该怎么评估？八股1. 电脑上访问一个网页的具体流程是什么？2. 了解TCP吗？3. Redis怎么做持久化？4. 如何结合RDB和AOF让Redis尽可能满足存储诉求？5. 调大模型时的temperature参数了解吗？代码相关问题1. 滑动窗口算法解决日志请求丢弃问题的思路是什么？你看看有什么问题想问我吗？

查看58道真题和解析

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

18772次浏览 170人参与

# 字节开奖 #

148914次浏览 665人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

47282次浏览 513人参与

# 如果春招能重来，我会___ #

19715次浏览 213人参与

# 薪资爆料 #

421634次浏览 2223人参与

# 除了线上，还能去哪些地方投简历 #

10824次浏览 110人参与

# 刚工作的你，踩过哪些坑？ #

46426次浏览 295人参与

# HR问：你期望的薪资是多少？如何回答 #

99111次浏览 830人参与

# 大学四年该怎么过，才不算浪费时间？ #

23652次浏览 104人参与

# 一份好的简历长什么样？ #

41782次浏览 505人参与

# 你面试被问到过哪些不会的问题？ #

122215次浏览 1944人参与

# 今年形式下双非本找得到工作吗 #

328541次浏览 1774人参与

# 诺瓦星云求职进展汇总 #

258796次浏览 1743人参与

# 双非本科求职如何逆袭 #

1645650次浏览 13060人参与

# 你觉得实习能学到东西吗 #

153955次浏览 1493人参与

# 职场破防瞬间 #

381572次浏览 2847人参与

# 你被哪些公司挂了？ #

193046次浏览 1043人参与

# 实习最晚的一次下班是几点 #

35812次浏览 171人参与

# 字节求职进展汇总 #

1845202次浏览 15385人参与

# 26届校招投递进展 #

670024次浏览 3953人参与

# 双非应该如何逆袭？ #

584020次浏览 6376人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务