快手大模型数据研发后端实习一面

1做下实习介绍
2说下你这个rag项目吧,整个流程
3那你是如何判断你检索结果好坏的 什么指标
4为什么用es的这个去向量化,和其他的有什么区别
5你置信度怎么算出来的
6的那你这个权重怎么设计的,怎么知道这个权重的比例是最好的
7说下实习吧,我看你写了用了kafka,kafka消费失败怎么解决的
8你在你实习过程中怎么解决这个消费失败?就是不是自动提交然后报错吗,其他的任务进来会阻塞吗
9kafka如何保证幂等性的
10能说下生产者这个幂等性的id底层是啥吗,用什么设计的
11kafka的主要参数有哪些,分区怎么设计的
12那你消费同一分区的时候是并发的吗
13说下你实习这个消费者并发于bulk批量写入机制怎么实现的,为什么他提高了吞吐量?之前是多少?
14你说你延迟到秒级,之前是什么级
15能说下你这个多表联查查询缓慢问题怎么解决的吗
16那你redis在这里起什么作用 存放什么数据一般
17那你这个Cache-Aside策略如何实现的怎么知道降低了负载40%,你测过吗
18设计多级缓存的目的是什么,一般都放什么数据?数据量很大吗
19那你整个数据的链路是什么?数据是什么数据一般?es-redis-db吗
20一般你们qps是多少,有测过吗?
21我看你实习写了微服务,讲下ACP是啥吧
22rpc调用用过吗
23反问
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务