字节- AML大模型后端开发-一二面

好久之前面的了,今天想起来发一下面经

一面

问开源
1. mcp 网关是怎么做的
2. 限流是怎么实现的
3. 模型的可观测是怎么实现的,具体有哪些指标
4. 这个DSL的序列化是怎么做的
5. 多租户是怎么实现的,物理隔离还是逻辑隔离
八股
1. 分布式理论
2. HTTP2和HTTP1的区别
实习
主要靠打了agent 多轮对话的长期记忆和短期记忆,问的比较深
并且延伸问了 KV Cache 的一些知识

手撕:手写一个支持多租户的限流器

二面
八股
1. JVM分区
2. 垃圾回收算法
3. Spring AOP的原理
实习
这里拷打了很多,但不知道为什么,一直说我们实现的方案不合理
agentic rag 工具调用的讨论

从记忆到 kvcache,引出了一个场景题,如果多轮对话中a没有命中kvcache缓存,后面的b,c可以命中吗?

agent分层架构怎么解决长链路的token溢出的

还有一些开源和实习的问题有点忘了
手撕 LRU

总体感觉二面体验有点差,不过也问出来很多简历上的问题
全部评论
多轮对话的长期和短期怎么答?
点赞 回复 分享
发布于 昨天 20:39 江西
有后续吗
点赞 回复 分享
发布于 昨天 14:18 浙江

相关推荐

评论
4
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务