字节大模型Agent-八股文拷打(转)

八股原理
1. 请介绍 Transformer 的结构组成及各部分作用
2. 如何降低 Transformer 的计算复杂度?常见的稀疏注意力变体有哪些?
3. LoRA 微调的原理是什么?秩 r 的选择会对模型表现产生什么影响?
4. KV Cache 是什么?为什么能极大地提升推理速度?
5. RAG 完整流程,构建向量检索库时如何处理时间衰减对召回的影响?
6. 微调时的训练数据是怎么构建的?如何保证样本多样性和质量?
7. 在 RAG+知识图谱的 Agent 系统中,知识图谱更新的机制是怎样的?如何保证实时性?
8. 训练 LoRA 模型时,你是如何选择冻结层的?依据是什么?
9. 在高并发查询 Agent 系统中,你会如何优化召回和生成阶段的延迟?
10. 大规模 Agent 系统在多线程/多进程场景下的资源调度策略如何设计?
11. 如果在 GPU 资源有限的条件下同时提供推理和微调服务,如何做资源分配和任务调度以保证时延和吞吐?
代码题
12. LeetCode 15 三数之和
#AI求职记录#
全部评论
感觉问的还挺多的啊
1 回复 分享
发布于 03-15 21:11 北京
手撕是acm模式还是普通的力扣模式啊
点赞 回复 分享
发布于 03-24 01:42 江苏

相关推荐

04-15 23:30
已编辑
广东工业大学 Java
1. 大二有时间出来实习吗?第一个项目(知识分享平台)相关问题1. 分享平台做了多久?几个人做的?2. 定制化的二进制检测技术(SDS)可以具体介绍一下吗?3. 位图(Bitmap)是怎么设计的?4. 为什么使用位图记录用户点赞行为?5. 用户增长后,位图该如何处理?6. 用户如何通过ID找到位图中对应的位?7. 用户ID取模后冲突了该怎么办?8. SDS是用来做什么的?9. 什么时候会触发SDS的更新?10. 定时任务怎么扫、扫什么范围来更新SDS?11. 为什么选择使用binlog来做事件发布?有别的方案吗?12. 点赞系统中的卡夫卡(Kafka)是用来干啥的?和binlog的链路关系是什么?13. 用户频繁点赞再取消,链路会一直发消息,如何确保消息的有序性?14. 灾难回放是什么时候触发的?15. 自定义的热key探测机制可以具体介绍一下吗?16. 怎么样识别哪一篇内容/哪些信息是经常被访问的?17. 如何确保存储和缓存之间的一致性?第二个项目(agent相关)相关问题1. 计划执行校验迭代的机制是怎么实现的?2. 中间的上下文是怎么样共享的?3. 上下文太长了该怎么办?4. 引入的RAG具体引入了一些什么样的信息?5. RAG的准确性该怎么评估?八股1. 电脑上访问一个网页的具体流程是什么?2. 了解TCP吗?3. Redis怎么做持久化?4. 如何结合RDB和AOF让Redis尽可能满足存储诉求?5. 调大模型时的temperature参数了解吗?代码相关问题1. 滑动窗口算法解决日志请求丢弃问题的思路是什么?你看看有什么问题想问我吗?
查看58道真题和解析
点赞 评论 收藏
分享
评论
3
21
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务