蚂蚁-NLP算法面经

部门:AI Force
10.21 一面
1、讲项目
2、检索器怎么训练的?
3、召回不准有什么方法提升召回率?
4、reranker有什么方法?
5、检索器和reranker的得分太相近,不可靠如何解决?
6、怎么解决模型输出有害的问题?
7、如何设计损失函数让两个分布尽可能的远?
8、决策树有哪些?
9、简单说一下GBDT的算法原理
10、HMM大概是怎么样的
11、口述编辑距离算法
============================
10.24  二面
1、项目
2、你的CoT是一步的推理吗?
3、ToT如何选取推理路径?
4、如果query和document字面上很相似,但实际上不一样,应该怎么避免召回?
5、我看你的项目基本都是pipeline的搭建,你有什么微调经验吗?
6、你怎么确定数据配比呢?
7、上采样和下采样是什么?
8、蒙特卡洛树搜索(MCTS)了解过吗?
9、微调出现灾难性遗忘怎么办?
10、rnn和Transformer的区别
11、你觉得mamba有可能取代Transformer吗
12、你会java和c++吗?
13、传统机器学习学过吗?
14、天池的比赛参加过吗?
===============================
10.28 hr面
===============================
10.30 三面
主要问实习
===============================
1月份发意向谈薪,已拒
=================
首页第一条帖子招大模型应用算法实习生,欢迎投递
全部评论
二面没做题吗
点赞 回复 分享
发布于 2025-02-19 15:10 上海

相关推荐

查看11道真题和解析
点赞 评论 收藏
分享
发点面经攒攒人品~1.项目拷打2.实习拷打3.你提到用了CKA你能解释一下它是怎么计算的吗?这个指标真的能评估对齐程度吗4.ModalityAdapter模态适配器这个模块你是怎么设计的?它是怎么起作用的?有没有做过ablation实验?5.对比学习里你怎么构造正负样本的?正负样本不容易区分的时候你们是怎么处理的?有没有用HNM6.你们项目里用了多个loss比如MSE + Contrastive Loss + KL 散度为什么这么设计?有没有出现loss拉扯现象7医疗组手那个项目你说做了Prompt模板设计,能不能举几个例子?分类模板和生成式模板在你们场景下分别怎么做的8你们用的知识库是静态的吗?有没有做向量索引?用的什么方案9怎么避免模型产生医疗幻觉?你们有没有做 hallucination 率评估11.你用过哪些模型推理框架?你觉得Ollama和vLLM区别在哪儿?在车端你们选它们的依据是什么?12.你们说做了14B的车端模型,你们是怎么用SFT数据去做微调的?数据怎么构建的13.评测体系你是怎么搭建的?评测指标都有哪些14.你说你们构建了车载Agent平台Agent链路是怎么调度的多轮对话怎么做状态维护?15.Rewrite模型是你做的,具体输入输出是什么?你们是把 rewrite放在检索前还是后?训练数据是人工构造的吗?16你现在要设计一个多模态模型用于车内驾驶员状态识别,传感器包括摄像头和力传感器,你会怎么设计这个 pipeline
点赞 评论 收藏
分享
评论
7
29
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务