AI面试相关之蚂蚁国际社招二面(凉凉)
这次面试感觉其实还行,但是到现在也没联系我,估计凉凉了。
这次面试,面试官很侧重于 LLM 在实际业务(特别是销售/营销场景)中的落地能力、工程化思维(如异常处理、耗时分析)以及 Prompt 的精细化控制,这段时间段段学了不了,但是还是感觉差点意思。
一、 业务逻辑与转化率优化 (ROI)
Q1:你们的“线索评分”机制是如何运作的?
- 回答: 基于四个维度进行打分: 1.联系方式完整性(基础门槛)。2.购买意向强度(结合大模型进行意图识别)。3.对话深度(交互轮次)。4.用户主动行为(如主动要求添加销售微信或留下电话)。 综合这些维度给出一个分数,通常分数较高(如大于 70 分)会被判定为高优线索。
Q2:如果出现“线索评分高,但实际转化率低”的情况,你怎么看待?如何提升 ROI?
- 回答: 分为“线索质量”和“ROI/成本控制”两部分来看: 转化漏斗分析: 大模型(AI)只占转化漏斗的前端(约 40%),后续 60% 依赖销售的跟进。线索评分高说明 AI 识别到了意图,但需要优化“线索分发机制”。比如,将高优线索做优先级的排序,第一时间推送给销售,并限制每日推送上限(如限制 200 条),保证销售精力集中在高质量线索上。控制成本提升 ROI: 优化系统策略,从“被动回答”转为“主动发问”引导用户。同时,在对话早期过滤掉明显无意向的用户,不再持续调用大模型,从而节省 Token 成本。
二、 Prompt Engineering 与工程化约束
Q3:场景题(共享屏幕看代码):如何设计 Prompt,让大模型严格按照指定的 JSON 格式输出,且不包含多余的废话?(这块没法记录了,就文字说一下好了)
- 回答: Prompt 设计分为三部分: System 指令: 明确大模型的角色定位。输出约束: 严格要求仅输出 JSON 格式,不输出任何解释性文本。规则与 Few-shot 示例: 给出明确的逻辑判断规则(例如信息不足时该怎么处理),并提供标准的输入输出示例(Few-shot)。
Q4:如果大模型“幻觉”或者没有严格按格式输出(比如缺失字段、格式乱掉),系统层面如何做兜底和容错处理?
- 回答: 采用“三层校验”机制: 第一层(Prompt 约束): 通过强指令和 Few-shot 尽量保证一次性输出正确。
第二层(代码级校验): 拿到结果后,使用正则匹配或 JSON 解析工具提取。如果解析失败,触发重试机制(Retry)或走降级策略。(JSON强校验+正则校验+重试机制+降级策略,这已经是标准答案了)
第三层(业务逻辑校验): 校验 JSON 内部的关键字段(如手机号)是否真实有效、是否符合业务逻辑要求。如果有关键字段缺失或造假,系统会生成反问话术,让模型再次向用户确认,而不是让模型自己瞎编。
三、 模型参数调优与系统架构
Q5:如果是做实体抽取或确定的逻辑分类任务,你会怎么调整 temperature、top_p 等参数?
- 回答: 对于需要高确定性的任务(如抽取、分类),会将 temperature 调得非常低(例如设为 0.2),避免模型过度发散。top_p 也会做相应限制,确保模型在概率最高的词中进行选择,保证输出的稳定性。
Q6:你简历上提到系统平均耗时是 800ms,这个 800ms 在系统内部的链路分布是怎样的?
- 回答: 详细拆解了耗时链路: 网关/网络层交互:约 20ms。内部业务逻辑(如安全审核、数据库查询):约 30-50ms。大模型调用(耗时大头):约 500-600ms。后置结果处理与组装:约 70ms。总体控制在 1 秒以内,并且在 C 端展示时会配合流式输出(Streaming)来优化用户体感。
四、 个人经历与 HR 考察点
Q7:看你 23-24 年在华为待的时间比较短,离职原因是什么?
- 回答: 当时是 OD 编制,主要做的是比较边缘、偏支持性的系统工作(偏 CRUD),核心业务接触不到,为了寻求更好的技术发展空间选择了离职。(我能说我项目被关系户接了?不能说啊,老东家一句不好的话都不能会说
)
Q8:现在为什么考虑从百度看机会?
- 回答: 主要是部门面临组织架构调整和裁员优化,整体环境不稳定,所以出来看新的机会。
Q9:你的英语口语和书面能力怎么样?(因为该岗位可能需要对接国际化/跨境卖家业务)
- 回答: 书面阅读和写技术文档没有问题。口语方面属于一般水平,如果是日常或特定场景需要提前准备一下。(面试后的复盘中,你和朋友也确认了英语能力在这个岗位属于加分项)。
面的时候感觉还可以,可能是base差的太大吧,反正到现在也没消息,感觉凉凉了。
#AI求职实录#
查看15道真题和解析