淘天-ai应用开发-一面

之前已经电话面过,这回为正式一面。

一、 实习项目

拷打实习,不方便透露;

二、 高并发演进与 MQ 消息中间件
1. 性能优化演进、

详细描述 AI 用例缺陷审查任务的优化过程

面对 1~2 亿条msg的突发消息洪峰(MQ 压力极大),除了单机单线程处理,还有什么更好的架构级解决方案?

2. RabbitMQ vs RocketMQ 技术选型

请对比 RabbitMQ 和 RocketMQ 的底层架构与优缺点。

这两种 MQ 分别适用于什么样的业务场景?

RocketMQ 的 ACK 机制和消息重发机制是怎样的?

如何在这两种 MQ 中实现顺序消费?

如何支持分布式事务消息?

三、 AI Agent 与 RAG 架构设计
1. RAG的痛点与优化

如何解决 RAG 检索出来的知识忠实度不够、回答有偏差的问题?

对于长文档(如 200~300M 包含图片的文档),Chunk(文本块)的切分策略是怎样的?

大模型上下文窗口变大后(如从 256K 提升至 1M),如何解决“中间遗忘 (Lost in the middle)”的问题?

2. Agent 编排与大模型框架

在简单的问答任务和复杂的配置任务中,分别采用了哪种 Agent 架构?

MAS 多智能体架构在处理复杂任务时有什么明显的缺点?
为什么选择 Spring AI 框架?在实际使用中发现它有什么缺陷?

四、 场景架构题与 AI 评测机制
1. Agent 评测体系 (Eval)

你们通过哪些指标来评测 Agent 的表现?
如何定义和评判一个回答是否是“高分回答”?
2. 真实大厂高容错场景设计

场景描述: 如果将你的 AI 配置助手放在天猫商家/运营的真实环境中,面对成千上万的用户请求,必须保证极高的容错率和准确率。同时,真实用户的反馈收集率通常极低(万分之几)。

问题要求: 在此背景下,如何升级你的系统架构?如何进行自动化的投放与评测闭环?

【无论过没过,双非本科能面淘天已经非常感谢🙏🙏🙏】#牛客AI配图神器#
全部评论

相关推荐

04-16 03:30
门头沟学院 Java
简直是夯爆了!!!1.实习项目相关问题2.详细介绍一下你做过的智能客服系统。3.你们这套系统主要的应用场景大概是怎么样的?能举个例子介绍一下。4.什么情况下需要用到你的那个 expert 相关技术?5.整套系统的主要难点是在于什么地方?6.中间的 Planner,它的规划机制是怎么样的?比如它底层需要调用哪些工具?是不是需要多轮规划?中间的一些详细设计是怎么设计的?7.你们怎么去评估客服对客户的输出是好还是坏?8.搜索功能是怎么实现的?9.你在中间起到的主要作用是什么?你做出了什么改进?10.你这个迭代的过程中,有 ground truth 吗?比如每一个 query 实际上最终最相关的商品是有哪些?11.你中间做了一些什么样的技术迭代?最终体现在人工评估指标上有什么样的提升?有做过对比吗?12.这个人工评估的指标是怎么设计的?最后它的指标结果怎么样?13.这个指标结果是内部人工评估的,还是线上的结果?14.中间优化的过程中,你们用的是一个什么样的模型?15.你的那个 expert 模型,怎么去训练的?样本从哪里来?16.导购场景的数据是真实的用户跟人工客服对话的场景数据吗?17.训练的样本量大概是多大?18.1000 条样本就足够训练你的这个模型了吗?19.你对比过训练之前跟训练之后,同样的问题模型学习后的能力提升大概有多少?20.你能做到比原始蒸馏出来的模型效果还强吗?21.训这个 8B 的模型用的是多大显存的?什么显卡?八股1.正常来说,1B 的模型在没有做任何量化的情况下,原始 FP 格式存储大概要占到多少显存?2.不考虑梯度的情况,单纯只考虑 Inference,把参数加载到显存里面大概要占多少显存?3.平时有用过一些量化加速的方法吗?4.常用的量化手段比如 INT4、INT8、BF,它们之间怎么做到加速的?你有了解过吗?5.FP 跟 BF 之间的区别,你了解吗?6.FP 和 BF 底层实现的区别主要在哪个地方?7.正常的 MP32 在底层数据存储上,小数是怎么表示的?手撕:有连续的 N 个正整数,随机抽出一个(不拿头尾),将其他数乱序放入 N-1 大小的数组中,找出被取出的数。要求时间复杂度 O (N),空间复杂度 O (1)。
查看28道真题和解析
点赞 评论 收藏
分享
评论
3
20
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务