字节大模型Agent-八股文拷打(转)

八股原理
1. 请介绍 Transformer 的结构组成及各部分作用
2. 如何降低 Transformer 的计算复杂度?常见的稀疏注意力变体有哪些?
3. LoRA 微调的原理是什么?秩 r 的选择会对模型表现产生什么影响?
4. KV Cache 是什么?为什么能极大地提升推理速度?
5. RAG 完整流程,构建向量检索库时如何处理时间衰减对召回的影响?
6. 微调时的训练数据是怎么构建的?如何保证样本多样性和质量?
7. 在 RAG+知识图谱的 Agent 系统中,知识图谱更新的机制是怎样的?如何保证实时性?
8. 训练 LoRA 模型时,你是如何选择冻结层的?依据是什么?
9. 在高并发查询 Agent 系统中,你会如何优化召回和生成阶段的延迟?
10. 大规模 Agent 系统在多线程/多进程场景下的资源调度策略如何设计?
11. 如果在 GPU 资源有限的条件下同时提供推理和微调服务,如何做资源分配和任务调度以保证时延和吞吐?
代码题
12. LeetCode 15 三数之和
#AI求职记录#
全部评论

相关推荐

发一下问题给大家参考,攒攒人品!1.项目拷打2.实习拷打3.检索融合的具体流程是什么?召回后有没有做 Rerank?4.Rerank 后返回几个块(Chunk)?有没有针对这个返回数量做过验证?5.Rerank 后的 TopK 截断是怎么做的?为什么是这个值?有没有其他截断方案?6.讲一下上下文工程(Context Engineering),Agent 的记忆(Memory)是怎么做的?7.请详细讲解分布式令牌桶限流的实现。8.漏桶算法(Leaky Bucket)的原理讲一下。9。滑动窗口算法限流讲一下。如果用代码实现,滑动窗口的结构体会包含哪些字段?10.滑动窗口和令牌桶相比有什么缺点?11.在 Redis 中,你会用什么数据结构来实现滑动窗口限流?12.LRU 缓存的实现原理讲一下。13.布隆过滤器(Bloom Filter)的底层原理和适用场景讲一下。14.MySQL 索引会在哪些情况下失效?15.在使用 LIKE 进行模糊查询时,索引什么情况下会失效?16.MySQL 的事务隔离级别有哪些?如何保证一致性?17.详细说说 MVCC 的实现,ReadView 的生成时机是怎样的?18.在不同的隔离级别下,一个事务分别会创造几个 ReadView?19.MySQL 都有哪些锁?它们的作用分别是什么?20.为什么选择 Python 和 Go 作为技术栈?在处理并发时有什么区别?21.手撕代码:实现反转链表
查看21道真题和解析
点赞 评论 收藏
分享
评论
点赞
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务