Code_Agent - 个人主页动态 - 牛客网

发布(194) 评论刷题收藏

04-12 19:49

广西大学算法工程师

途虎养车大模型算法开发一面

1. 自我介绍2. 介绍下你简历上这个项目, 说说难点, 遇到什么问题,怎么解决的,你这个项目是网上找的 还是怎么来的3. 为什么汽车后市场推荐比普通内容推荐更难做长期目标优化因为它不是纯消费型即时反馈场景，很多行为从曝光到成交会跨天甚至跨周，中间还夹着门店库存、服务时段、用户行程安排和价格波动这些外部因素。你今天推荐一个保养套餐，用户不一定马上下单，但不代表这次推荐没有价值；同样，用户今天点击了也不一定转化，因为可能只是先了解方案。长期目标优化难在信用分配，你必须回答当前一次曝光到底对后续留资、咨询、预约、核销贡献了多少。工程上通常不会直接拿“最终成交”做唯一监督，而是拆成若干代理目标，比如...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-12 19:42

广西大学算法工程师

哔哩哔哩大模型算法一面

1. 自我介绍2. 为什么推荐系统里要做多目标优化，而不是只优化点击率只优化点击率会把系统推向强刺激、短反馈的内容，短期看 CTR 好看，长期可能损伤时长、留存、消费深度和用户满意度。推荐系统真正面对的是一个多目标约束问题，点击、时长、转化、留存、内容生态健康、创作者收益往往都重要，而且这些目标之间存在天然冲突。多目标优化的核心不是把几个 loss 简单加权，而是处理目标尺度不一致、梯度冲突和业务优先级变化。很多系统前期用静态加权，后期会演进到门控式任务塔、动态权重、MMoE、PLE，甚至通过因果或强化学习方式做长期目标建模。优化的是用户长期价值，而不是某一个表层指标。3. 当业务里同时有视频...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-12 12:42

广西大学算法工程师

淘天 AI Agent开发一面

1. 自我介绍2. 多阶段 RAG 里同时使用 BM25 和向量召回，混合检索策略通常怎么设计混合检索的关键不是把两路结果简单拼起来，而是根据问题类型决定两路召回各自承担什么角色。BM25 对精确术语、错误码、接口名、字段名、版本号这类关键词命中很强，向量召回则更擅长语义改写、口语化表达和抽象问题。真正稳定的设计一般是先并行召回，再做去重、融合、重排，最后再进入上下文构建阶段。如果问题本身是“精确定位型”，比如某个报错码、类名、接口路径，BM25 权重通常更高；如果问题是“意图表达型”，比如用户用自然语言描述故障现象，向量召回的权重会更高。工程里比较常见的是先取两路 topk，再用 RRF 或...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-12 12:38

广西大学算法工程师

小红书 AI Agent开发一面

1. 自我介绍2. 介绍你写的这个项目3. 为什么要做多 Agent，而不是把所有能力都塞进一个 Agent多 Agent 的核心价值不是“看起来更高级”，而是把复杂任务里的角色分工显式化。单 Agent 在任务很长、工具很多、约束很多的时候，容易把规划、检索、判断和执行混在一起，导致上下文污染、错误放大、调试困难。多 Agent 可以把流程拆成规划 Agent、检索 Agent、执行 Agent、审查 Agent，每个 Agent 只负责一类清晰目标，行为边界更稳定。但多 Agent 也不是默认更好。它会引入额外通信成本、状态同步复杂度和错误传播路径。真正适合多 Agent 的场景，一般满足...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-12 12:21

广西大学算法工程师

淘天 AI应用开发二面

1. Agent 和传统 workflow 的本质区别是什么，什么时候该选 Agent，什么时候不该选传统 workflow 的核心是路径预定义，系统知道每一步做什么、怎么流转、失败后怎么回退，所以它更适合规则清晰、链路稳定、审计要求高的场景。Agent 的核心则是把部分决策权交给模型，让它在运行时决定下一步查什么、调什么工具、如何分解任务，因此更适合任务开放、输入噪声大、解法不唯一的场景。真正的分界线不在“有没有模型”，而在“是否允许运行时规划”。如果目标是工单分类、审批流转、固定字段抽取，workflow 往往更稳；如果目标是复杂排障、代码仓库理解、跨工具探索式分析，Agent 才更有价值...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-12 12:12

广西大学算法工程师

淘天 AI应用开发一面

1. 做一下自我介绍2. RAG 分块策略应该怎么选，真正影响效果的核心因素是什么分块策略不是越细越好，也不是统一按 token 长度切就行。真正影响效果的是 chunk 是否保留了完整语义单元、是否带有足够的定位信息、是否能在召回后被模型直接利用。像制度文档、规则文档、FAQ、表格和多层级说明，最佳切法差异很大。比较稳的方式通常是结构优先、语义补充、长度兜底，也就是先尊重标题、段落、表格、列表，再在超长片段内部做语义切分。这样做的目标不是生成整齐块，而是让每个 chunk 自带最小可回答上下文。3. 怎么评估 RAG 的效果，除了准确率还能看什么RAG 效果不能只看最终回答对不对，因为那样很...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-12 12:07

广西大学算法工程师

美团 AI应用开发一面

1. 做一下自我介绍2. 如果一个核心链路已经同步调用很多下游了，为什么还要引入消息队列，而不是继续堆线程池消息队列真正解决的不是“异步”两个字，而是削峰、解耦、容错和流量治理。同步链路堆线程池只能把等待成本从调用方挪到自己进程里，并不能改变系统容量边界；一旦下游抖动，请求会在调用链上层层堆积，最终把连接池、线程池和网关超时一起拖崩。引入 MQ 后，主链路可以只做核心事务，非核心逻辑异步化，下游能力不足时也能通过堆积和消费速率控制做缓冲。不过 MQ 不是银弹，如果业务要求强一致、低延迟、同步结果可见，盲目异步反而会把复杂度转移到补偿和状态机里。3. 从生产端到消费端，怎么把“消息不丢”这件事讲...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-12 12:03

广西大学算法工程师

腾讯 AI应用开发一面

1. 做一下自我介绍2. 讲一下你做的这个平台，重点说难点 解决了什么问题这个项目的核心不是“把文档喂给模型”，而是先把不同来源的材料转成可稳定检索、可引用、可更新的知识单元。整体架构一般包括文档接入、格式解析、结构抽取、分块与向量化、倒排索引、重排服务、回答生成和引用回填。我负责的部分主要是 chunk pipeline、索引写入和查询编排。难点主要在复杂文档结构，比如目录、页眉页脚、跨页表格、附件引用和条款层级，如果直接按长度切块，召回会很乱，模型也很容易把不同证据拼错。 def build_index(doc): blocks = parse_document(doc) chunks =...

腾讯一面2294人在聊

0 点赞评论收藏

分享

04-12 11:56

广西大学算法工程师

阿里云 AI应用开发一面

1. 做一下自我介绍2. 你对网络安全方向怎么看，为什么 AI 应用在这个方向上既有价值又有风险网络安全很适合和大模型结合，因为它天然就是高噪声、多源数据、强依赖经验判断的场景。告警研判、攻击链还原、漏洞摘要、规则解释、工单辅助这些任务都能显著提效。但安全场景比普通问答更敏感，问题不只是答得快不快，而是结论能不能被验证、引用是不是准确、有没有被 prompt injection 或恶意样本绕偏。安全方向里的 AI 应用，最终拼的不是模型会不会说，而是证据链是否闭环、输出是否可审计、权限边界是否足够严。3. 介绍一个你做的这个项目，重点讲架构和你负责的部分4. 为什么要用 RAG，而不是直接让模...

阿里云一面176人在聊

0 点赞评论收藏

分享

04-10 21:29

广西大学算法工程师

高德 AI应用开发一面

1. 做一下自我介绍，重点讲你在 AI 编码和跨端工程结合上的经历2. Flutter 的核心原理是什么，如果不从 Widget 开始讲，你会怎么讲Flutter 真正的核心不是 Widget，而是它自带了一整套渲染体系。它绕过了各平台原生控件树，直接基于 Skia 或 Impeller 进行绘制，上层通过 Widget、Element、RenderObject 三棵树来描述配置、生命周期和布局绘制职责。Widget 是声明式配置，Element 负责把配置和实例关系稳定下来，RenderObject 才是真正参与 layout、paint、hitTest 的对象。这样做的好处是跨平台一致性很...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-10 20:59

广西大学算法工程师

滴滴大模型算法开发一面

1. 自我介绍2. 多模态里的旋转位置编码是怎么落到二维视觉 token 上的二维视觉 token 不像纯文本那样天然是一维顺序，所以多模态里的 RoPE 通常不会直接照搬文本侧。常见做法是把二维位置拆成行和列两个轴，分别做旋转位置编码，再把两个方向的信息组合到同一个视觉 token 表示里。这样模型在注意力里不仅能感知“前后”，还能保留一部分“上下左右”的相对结构。真正难的不是公式本身，而是视觉 token 经过压缩、重采样、patch merge 之后，原始空间坐标已经不再一一对应。这个时候二维 RoPE 的设计就要和视觉编码器、projector 以及后续 token 压缩方式一起看，否...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-10 20:47

广西大学算法工程师

联想大模型开发一面

1. 自我介绍2. 训练一个 decoder-only 大模型时，为什么 embedding 层和 lm head 常常共享权重权重共享本质上是一种参数高效和统计一致性的设计。输入端 embedding 学到的是“token 到向量空间”的映射，输出端 lm head 学到的是“隐藏状态到词表概率”的映射，如果这两个空间本身就在描述同一个词表语义，那么共享权重可以减少冗余参数，并让输入语义空间与输出判别空间保持一致。从优化角度看，共享权重还能起到轻微正则化作用，尤其在词表非常大时更明显。代价是模型表达自由度下降了一点，但对大多数语言模型来说这个损失远小于收益。很多实现里会保留一个独立 bias...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-10 20:34

广西大学算法工程师

雷鸟创新大模型开发一面

1. 自我介绍2. PPO、TRPO、DPO 分别是什么，它们的核心差异在哪TRPO 的出发点是让策略更新别跨太大步，它通过约束新旧策略的 KL 距离，把优化问题写成一个带信赖域的约束优化，所以理论上比较稳，但实现复杂、计算成本也高。PPO 可以看成是 TRPO 的工程化近似，它不直接解复杂约束问题，而是通过 clip 或 penalty 的方式，限制策略更新过猛，因此在实践里更常用。DPO 和前两者不太一样，它不是传统在线 RL，而是直接从偏好对里学习一个“更偏向 chosen、压低 rejected”的目标，相当于把 reward optimization 吸收到一个更简单的监督目标中。P...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-10 20:23

广西大学算法工程师

京东 AI应用开发一面

1. 自我介绍2. 讲一下你做的项目，重点说你负责的模块和难点3. 你在做 Agent 的过程中，真正学到的东西是什么，最大的坑是什么真正学到的不是 Prompt 怎么写得花，而是怎么把模型能力约束进一个可控系统里。比如什么时候让模型自由推理，什么时候必须走工具，什么时候直接拒答，什么时候中断循环，这些都不是模型自己能解决的。最大的坑一般是把模型当成确定性组件用，结果线上一旦遇到模糊输入、脏数据或者工具超时，链路就开始发散。后面通常会补上三层约束：输入规范化、工具白名单、执行状态机。这样即使模型发挥不稳定，系统也不会直接失控。4. RAG 这条链路里，最容易被忽略但最影响效果的环节是什么最容易...

AI-Agent面试实战...

0 点赞评论收藏

分享

04-10 20:16

广西大学算法工程师

猿辅导大模型开发一面

1. 自我介绍2. RAG 怎么优化，评估时你会看哪些指标RAG 的优化一般不能只盯着生成端，很多问题其实出在检索阶段。常见优化思路包括 query rewrite、chunk 切分策略调整、混合召回、重排序、上下文压缩和引用约束。比如文档切得太碎，召回会有信息断裂；切得太长，又容易把无关信息一起带进来，生成端会受污染。真正线上效果好的 RAG，通常不是“某个 embedding 更强”，而是检索、排序、上下文组织和回答约束配合得比较好。评估时我一般拆成两层。第一层看检索，比如 Recall@k、MRR、HitRate，看相关证据能不能被捞上来；第二层看生成，比如答案正确率、faithfuln...

AI-Agent面试实战...

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务