淘天应用开发算法岗面经
1.自我介绍
2.拷打项目:在多模态Embedding时,你如何平衡文本语义和图像视觉特征在计算相似度时的权重?
3.拷打项目:如果用户反复说同一件事,你会重复存储还是进行语义合并?使用MCP接入多个测评工具时,如果两个工具对同一个问题回答格式不统一,怎么处理?
4.在推理阶段,为了消除LoRA带来的额外延迟,你会进行权重Merge吗?
5.如果Agent发现调用的工具报错,如何设计Prompt引导它用报错信息进行重试,而不是直接报错给用户?
6.在长对话中,除了截断,你了解哪些更高效的上下文压缩方法?
7.在一个多Agent系统里,由LLM做Router分发任务和由固定规则分发相比,各有什么优劣?
8.在Milvus里,你如何实现BM25和向量检索分数对齐?
9.如果限定只检索某个时间之后的数据,向量数据库里如何实现标量过滤?
10.了解LoRA微调吗?在训练LoRA时,两个参数矩阵分别是如何初始化的?
11.讲讲QLoRA的核心思想
12.如果你微调的是逻辑推理任务,相比于对话任务,你认为秩应该大还是小?
13.如果并发调用10个不同的Embedding接口,asyncio.gather相比多线程在资源消耗上有什么优势?
14.在垂域指令微调时,如果模型原本的通用能力下降,你有哪些方法解决?
16.DPO在训练时,为什么不需要像PPO那样在线采样生成回答?DPO数据格式是什么样的?
17.手撕:合并K个升序链表
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2.拷打项目:在多模态Embedding时,你如何平衡文本语义和图像视觉特征在计算相似度时的权重?
3.拷打项目:如果用户反复说同一件事,你会重复存储还是进行语义合并?使用MCP接入多个测评工具时,如果两个工具对同一个问题回答格式不统一,怎么处理?
4.在推理阶段,为了消除LoRA带来的额外延迟,你会进行权重Merge吗?
5.如果Agent发现调用的工具报错,如何设计Prompt引导它用报错信息进行重试,而不是直接报错给用户?
6.在长对话中,除了截断,你了解哪些更高效的上下文压缩方法?
7.在一个多Agent系统里,由LLM做Router分发任务和由固定规则分发相比,各有什么优劣?
8.在Milvus里,你如何实现BM25和向量检索分数对齐?
9.如果限定只检索某个时间之后的数据,向量数据库里如何实现标量过滤?
10.了解LoRA微调吗?在训练LoRA时,两个参数矩阵分别是如何初始化的?
11.讲讲QLoRA的核心思想
12.如果你微调的是逻辑推理任务,相比于对话任务,你认为秩应该大还是小?
13.如果并发调用10个不同的Embedding接口,asyncio.gather相比多线程在资源消耗上有什么优势?
14.在垂域指令微调时,如果模型原本的通用能力下降,你有哪些方法解决?
16.DPO在训练时,为什么不需要像PPO那样在线采样生成回答?DPO数据格式是什么样的?
17.手撕:合并K个升序链表
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
点赞 评论 收藏
分享
查看21道真题和解析 点赞 评论 收藏
分享