数字马力AI算法工程师面经

双非硕一年经验社招,之前只做CV
1,4.10一面 简述下transformer,注意力机制公式,QKV cache ,闲聊提了一个场景如何用Yolov8检测,知道Lora 吗?简述lora 原理以及工作原理。有无大模型训练经验,怎么训练的,模型推理加速用的是什么。
2,4月14二面,简述项目以及职则,说说CNN和tranformer 区别,项目中收获是什么,项目用的dify 还是langchain,了解lang graph吗,为什么用langchain ,说下rerank ,项目中用的什么检索策略,模型训练是否使用量化,数据管理用的什么,数据原因引起的大模型能力不足具体是数据的什么问题。说下梯度削减的训练策略
3,4月17 HR面
4,感谢信

目前想起来的就这些,后续回想有的答的确实不好,毕竟经验不太够,下次吧 #面经#  #数字马力#

全部评论
这跟技术面没关系了吧,是不是hr面没发挥好
点赞 回复 分享
发布于 04-24 20:56 河南
感谢信hr面完多久发的
点赞 回复 分享
发布于 04-19 17:32 上海

相关推荐

1️⃣自我介绍2️⃣项目拷打这一部分决定了面试官对于你经验的评估,项目的理解要深一些,这个只能通过不断打磨完善项目经历。✅微调项目:1.业务背景2.数据的构成,是否使用了合成数据3.训练的过程中用了什么方法(为什么用这样的方式,用别的方式会有什么问题,是否尝试过)4.如何评估整体的效果5.微调之后是否还会出现幻觉的问题,出现了的话应该怎么处理6.这个能力是否只能用在当前业务场景,是否可以作为一个通用的能力7.是否尝试过用其他的基座模型✅应用层项目:1.业务背景2.逻辑框架3.优化前和优化后的能力差距4.遇到最大的困难是什么?怎么解决的是否还有别的优化方式5.某个流程是否可以进行再优化6.上线之后的效果反馈3️⃣通识考察(1)Transformers 和之前的模型的区别,为什么 Transformers 好?(2)介绍下 Bert,框架,预训练和后续的微调任务?(3)为什么 Bert 适合做向量模型,底层原理是什么?(4)RoBERTa 做了什么优化?(5)想要大模型输出的内容都为 json 格式,怎么实现?(6)OOM 问题怎么处理(7)大模型的参数量是怎么计算出来的?(8)DeepSeek R1 的训练方式,GRPO 的原理是什么?(9)基于过程的强化学习和基于结果的强化学习的差异是什么?(10)Agent 的概念是什么?整体流程是怎么样的?(11)DeepSeek R1 对于 Agent 的能力是否有提升,如何进行运用?(12)RAG 的整体流程和评估方式?(13)如何解决 RAG 中信息覆盖率低、幻觉、逻辑计算的问题?(14)大模型的数据合成应该怎么做?有哪些方式?(15)DeepSpeed 的三个 stage 分别是什么?有什么作用?(16)模型并行和数据并行的区别是什么?这两种方式的数据流和梯度是怎么更新的4️⃣手撕代码✅算法代码:手写位置编码手写多头注意力机制Leetcode:零钱兑换最长递增子序列打家劫舍最长公共子序列跳跃游戏📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
点赞 评论 收藏
分享
评论
3
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务