蚂蚁/智能信息/饿了么面试

算法的面试最近基本上都是项目为主, 也没啥八股,就没写面经。
蚂蚁是算法工程 二面,饿了么是 NLP 二面, 智能信息是 NLP 一面。

蚂蚁基本没问啥,就是针对项目聊了一会时间。
重点是后面的代码题给我整不会了。
1. leetcode84 柱状图中的最大矩形(上个月刷了,经典单调栈,但是这题感觉我当时写就不太理解, 面试官问我思路我脱口而出单调栈,但是写不出来)
2. 84 没写出来,给我换了一个,149。又是一个 hard(开始无语,就想早点结束给我挂了算了。 这题我也没写过, 暴力肯定不难。 但是我说这个我想不到比较优的解)
3. 又给我换了一个, 这次给我一个 easy, 让我把一串字符串的空格移动到最后(竟然还给我做道题,这个时候都一个小时多了已经,我还以为会直接结束)
然后面试官让我之后可以把前面两道题代码补进那个网页里(结果第二题没来得及补,就进不去了)

智能信息一面,夸克 医疗创新
1. 一样聊在蚂蚁实习的算法项目
2. 中途问了一下, PEFT 的那几种微调的区别,就大概讲了一下我自己的理解
3. 我对大模型训练的流程熟悉吗?(就大概讲了一下全流程)
4. 了解 RLHF 吗(不太了解,没做过。就随便讲了一下奖励模型啥的)
5. DPO 知道吗(不知道怎么做的,就没问了)
6. 你觉得应该从哪些方面一个大模型的好坏?(随便说了几个, 知识储备, 指令跟随, 安全对齐, 对话逻辑)
7. 那你认为, 你说的这几种能力,都是在模型训练流程的哪个部分获得的?(挺有意思的问题。 知识储备是预训练获取的, 指令跟随一般是做微调, 安全对齐可能是 SFT rlhf, 对话的逻辑性应该都有关)
还有啥不记得了, 也没做代码题。 面后不久就约二面了。我笔试都还没做呢

饿了么二面
饿了么二面有点深挖项目了, 很多我都不太清楚。
1. 项目介绍
2. 深入聊大模型梯度攻击(这东西在蚂蚁做的, 每次说这个我都很累, 自己讲的面试官都听不明白, 不懂怎么做的。 然后就会出现很多牛头不对马嘴的问题,饿了么二面就一直卡在一个地方说了很久。
3.  那你们这个自回归任务用的 loss 是什么? 回归任务常用的 loss 有哪些(这我 ** 还真没了解, 就知道 L1 L2 范数这种,或者用 cos距离)
还有一些啥不记得了,饿了么二面时间感觉就 40 分钟,也没做题
全部评论
佬夸克有后续吗
1 回复 分享
发布于 2024-04-21 13:20 新加坡
佬,梯度攻击那个是指对抗学习吗
点赞 回复 分享
发布于 2024-08-29 21:37 广东
试下美团其他组
点赞 回复 分享
发布于 2024-04-22 12:45 上海
通过了吗 佬
点赞 回复 分享
发布于 2024-04-17 17:25 广东
给佬点个赞,期待更新
点赞 回复 分享
发布于 2024-04-17 17:23 浙江

相关推荐

发点面经攒攒人品~1.项目拷打2.实习拷打3.你提到用了CKA你能解释一下它是怎么计算的吗?这个指标真的能评估对齐程度吗4.ModalityAdapter模态适配器这个模块你是怎么设计的?它是怎么起作用的?有没有做过ablation实验?5.对比学习里你怎么构造正负样本的?正负样本不容易区分的时候你们是怎么处理的?有没有用HNM6.你们项目里用了多个loss比如MSE + Contrastive Loss + KL 散度为什么这么设计?有没有出现loss拉扯现象7医疗组手那个项目你说做了Prompt模板设计,能不能举几个例子?分类模板和生成式模板在你们场景下分别怎么做的8你们用的知识库是静态的吗?有没有做向量索引?用的什么方案9怎么避免模型产生医疗幻觉?你们有没有做 hallucination 率评估11.你用过哪些模型推理框架?你觉得Ollama和vLLM区别在哪儿?在车端你们选它们的依据是什么?12.你们说做了14B的车端模型,你们是怎么用SFT数据去做微调的?数据怎么构建的13.评测体系你是怎么搭建的?评测指标都有哪些14.你说你们构建了车载Agent平台Agent链路是怎么调度的多轮对话怎么做状态维护?15.Rewrite模型是你做的,具体输入输出是什么?你们是把 rewrite放在检索前还是后?训练数据是人工构造的吗?16你现在要设计一个多模态模型用于车内驾驶员状态识别,传感器包括摄像头和力传感器,你会怎么设计这个 pipeline
点赞 评论 收藏
分享
03-25 23:25
兰州大学 Java
查看21道真题和解析
点赞 评论 收藏
分享
评论
10
30
分享

创作者周榜

更多
正在热议
更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务