阿里淘天AI应用开发一面
1.请做一段简单的自我介绍。
2.做多模态Embedding任务时,如何平衡文本语义与图像视觉特征的相似度计算权重,若用户检索图纸特定参数却召回大量外观相似零件图,问题根源是什么,同时Ragas指标中Context Precision过低该如何优化?
3.你的向量记忆库采用何种去重方案,用户重复表述同一内容时会重复存储还是语义合并,基于MCP接入多测评工具且同问题返回格式不统一时该如何处理?
4.面对用户模糊含糊的提问,Agent会直接检索知识库还是先反问用户确认需求?
5.当Agent调用工具出现报错时,该怎样设计提示词引导模型利用报错信息自主重试,而非直接将错误返回给用户?
6.长对话上下文处理中,除文本截断外,请列举并说明多种更高效的上下文压缩方案。
7.多Agent系统中,依靠LLM充当路由分发任务与依靠固定规则分发任务,二者分别具备哪些优势与劣势?
8.基于Milvus数据库,如何完成BM25检索与向量检索的分数归一对齐操作?
9.需要限定检索某一时间节点之后的数据时,向量数据库该如何高效实现标量条件过滤?
10.是否了解LoRA微调技术,训练LoRA过程中两个核心参数矩阵分别采用怎样的初始化方式?
11.请详细阐述QLoRA算法的核心设计思想与关键原理。
12.针对逻辑推理类任务做LoRA微调,对比普通对话任务,LoRA秩的取值应该偏大还是偏小并说明原因?
13.模型推理部署阶段,为消除LoRA分支带来的推理额外延迟,是否会执行权重Merge操作?
14.垂直领域指令微调后模型通用能力出现退化下降,有哪些可行的解决与改善办法?
16.对比PPO算法,DPO训练无需在线采样生成回答的核心原因是什么,标准DPO训练的数据格式包含哪些内容?
17.高并发场景下同时调用10个不同Embedding接口,asyncio.gather相较于多线程方案在系统资源消耗层面具备哪些具体优势?
18.请手写代码实现合并K个升序链表的算法题解法。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2.做多模态Embedding任务时,如何平衡文本语义与图像视觉特征的相似度计算权重,若用户检索图纸特定参数却召回大量外观相似零件图,问题根源是什么,同时Ragas指标中Context Precision过低该如何优化?
3.你的向量记忆库采用何种去重方案,用户重复表述同一内容时会重复存储还是语义合并,基于MCP接入多测评工具且同问题返回格式不统一时该如何处理?
4.面对用户模糊含糊的提问,Agent会直接检索知识库还是先反问用户确认需求?
5.当Agent调用工具出现报错时,该怎样设计提示词引导模型利用报错信息自主重试,而非直接将错误返回给用户?
6.长对话上下文处理中,除文本截断外,请列举并说明多种更高效的上下文压缩方案。
7.多Agent系统中,依靠LLM充当路由分发任务与依靠固定规则分发任务,二者分别具备哪些优势与劣势?
8.基于Milvus数据库,如何完成BM25检索与向量检索的分数归一对齐操作?
9.需要限定检索某一时间节点之后的数据时,向量数据库该如何高效实现标量条件过滤?
10.是否了解LoRA微调技术,训练LoRA过程中两个核心参数矩阵分别采用怎样的初始化方式?
11.请详细阐述QLoRA算法的核心设计思想与关键原理。
12.针对逻辑推理类任务做LoRA微调,对比普通对话任务,LoRA秩的取值应该偏大还是偏小并说明原因?
13.模型推理部署阶段,为消除LoRA分支带来的推理额外延迟,是否会执行权重Merge操作?
14.垂直领域指令微调后模型通用能力出现退化下降,有哪些可行的解决与改善办法?
16.对比PPO算法,DPO训练无需在线采样生成回答的核心原因是什么,标准DPO训练的数据格式包含哪些内容?
17.高并发场景下同时调用10个不同Embedding接口,asyncio.gather相较于多线程方案在系统资源消耗层面具备哪些具体优势?
18.请手写代码实现合并K个升序链表的算法题解法。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看9道真题和解析 点赞 评论 收藏
分享