wish_21 - 个人主页动态 - 牛客网

05-03 05:25

门头沟学院算法工程师

阿里云暑期实习Agent面经分享

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1. 实习拷打2. 项目拷打2.1 现在复盘一下，有哪些可以优化改进的点2.2 问知识图谱构建和维护怎么做，困难点有什么？3. 场景题3.1 问到了他们正在做的场景3.2 文档撰写的速度可能跟不上产品迭代的速度，怎么搭建agent来解决这个问题？4. 对agent的了解，context engineering和现在的harness engineering 的区别，平时用小龙虾来做什么，claude code怎么做记忆管理，做梦机制是什么？没有手撕

查看3道真题和解析

0 点赞评论收藏

分享

04-25 16:05

门头沟学院算法工程师

27暑期实习腾讯llm二面给我面麻了

面试很难，还是要多多练习1.介绍论文2.bf16、fp16和fp32，并进行计算。3.lora微调的细节，量化相关知识然后开始漫长的手撕过程4.手撕ppo5.算马尔可夫决策过程的y阈值，我感觉是个无穷级数？6.算模型sft的参数量大小及显卡利用率7.是否重合链表（hot100）8.如何使得一个输入向量x在经过一个或多个全连接层后，其输出向量y所在子空间基底尽可能接近标准正交基

查看8道真题和解析

0 点赞评论收藏

分享

04-20 21:45

门头沟学院算法工程师

蚂蚁暑期推荐算法一面面经分享 1h

继续来分享下最近的面经~1.项目相关2.八股:1.ChatGPT在模型结构为什么使用decoder only?2.优化器八股?3.方差和偏差的trade-off?4.如果loss震荡，可能是什么原因，如何排查?5.训练的时候，打印什么内容可以定位上述问题?6.transformer和rnn相比，为什么更好?7.国内几个大模型的主要区别是什么?3.无手撕

查看7道真题和解析

0 点赞评论收藏

分享

04-14 12:15

门头沟学院算法工程师

拼多多暑期推荐算法实习一面（凉凉

面试很难，还是要多多练习，感觉自己说不明白业务逻辑1.实习拷打2.问我项目里为什么选择DPO3.强化学习和监督微调有什么不同4.讲讲DPO算法，beta 的作用是什么5.你看了这么多强化学习的算法，有什么心得？强化学习是怎么从最开始演变到现在的？6.讲讲word2vec算法，为什么向量空间中比较接近的token在语义上也是相近的？7.手撕了一个0/1背包的题

查看6道真题和解析

0 点赞评论收藏

分享

04-11 09:40

门头沟学院算法工程师

字节 Agent算法凉经分享 75min

攒攒人品！有面试过同岗的朋友欢迎评论区交流1. 在LM-as-Judge评测中，如何设计实验验证评测模型的打分偏差，并消除其对最终结果的系统性影响？2. 多模型交叉评测时，若出现明显的打分分布偏移，如何量化偏移程度并设计校准策略？3. 针对Data Agent的数值计算与逻辑推理场景，如何设计细粒度评测维度，避免只以最终结果论对错？4. 如何构建高难度的对抗评测样本，以有效暴露Agent在工具调用、参数传递中的隐蔽缺陷？5. 如何评估评测 pipeline 本身的可靠性？如何证明你的评测结果是可复现、可置信的？6. 在长链路多步推理场景下，如何设计评测机制，区分中间步骤错误与最终生成错误？7. 面对人工评测与自动化评测结果严重冲突时，如何设计决策机制与置信度评估方案？8. 如何在不显著增加调用成本的前提下，提升LM-as-Judge对细微错误、逻辑漏洞的检测能力？9. 模型迭代后如何设计回归评测体系，精准定位能力退化点并归因到具体训练或结构改动？10. 多Agent协同任务中，如何设计评测指标区分单Agent能力问题与交互调度逻辑问题？手撕：现有列表 A，B、C 均调用 A，B 执行出错导致 C 连带错误，从评测与测试角度该如何定位根因？

查看11道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务