理想+ 大模型面经

一面 10.10日 1.5h(一面挺难,像cto)
自我介绍,讲一下大模型应用项目(我讲的nl2sql的项目)
项目背景,总体思路,解决什么问题,指标是什么
细节拆分:
1.数据集怎么构建的,什么规模,有没有质量评估
2.模型底座是什么,这些不同底座什么区别,什么规模
3.训练方法,用的什么sft,有什么不同,有什么优缺点,原理上解释不不同方法的差别
4.评估指标是什么,这些指标存在哪些问题
5.模型推理是怎么做的,有没有cot,tot等等,还是单轮
6.模型可控性如何实现,怎么保证可控性
7.模型部署的平台,推理效率怎么样,如何提升推理效率
8.有没有上线,面临什么问题,怎么解决
9.给一个总的输入输出样例,每一步包含什么prompt,多轮推理每一步输出什么结果,模拟一下,数据集格式是否要调整成这样,数据形式是什么,怎么拆分成多轮形式等等。。

到这里项目差不多了大概问了45min
然后是八股+开放式问题
1.大模型前景
2.大模型主要存在的问题和解决思路(幻觉,定向编辑,继续训练等等)
3.大模型加速框架了解多少,知不知道原理 如何进行加速优化
4.为什么要用大模型做传统结构化解析任务 你对用大模型做这些事有什么看法

到这差不多1小时
最后是能不能实习,对最新的研究了解多少,看过多少最新论文等等

我本以为结束了,但是,最后我们来做一道题吧
题我忘了,好像是一个迭代法求根的题,反正当时已经神志不清了,好像没ac

2.二面10.13日 45min
很简单,感觉是部门leader,简单问了问项目,普通八股,大模型上线会有什么问题,占用多少资源,怎么优化等等,比一面简单太多
全部评论
能问出这些问题的团队肯定挺好的。
10 回复 分享
发布于 2023-11-06 13:52 北京
这问的算前沿难度吧?基本都是最新问题 大佬还能答出来 👍🏻做过实习吗
3 回复 分享
发布于 2023-11-05 12:36 北京
月薪多少
1 回复 分享
发布于 2024-01-23 13:01 上海
lz,大模型应该怎么学呢~
1 回复 分享
发布于 2023-11-29 19:33 天津
大佬怎么学习的
点赞 回复 分享
发布于 2024-01-29 13:29 福建
大佬最后签了吗
点赞 回复 分享
发布于 2023-12-21 14:14 江苏
LLM应用么?
点赞 回复 分享
发布于 2023-11-11 16:10 美国
请问有后续吗
点赞 回复 分享
发布于 2023-11-10 19:44 上海
请问一下这个是那个岗?多模态还是智能座舱啥的?
点赞 回复 分享
发布于 2023-11-02 17:48 湖北

相关推荐

09-22 14:41
已编辑
门头沟学院 算法工程师
面试是24年7月的现在已经入职几个月了,补一下面经,帮有需要的同学参考。BG:本硕985 计算机论文1A1B一面:技术面自我介绍 & 简历相关。简单介绍了自己在多模态和大模型方向的研究/工作经历,包括在校期间的论文工作以及实习经历。面试官主要针对简历上的项目提了一些细节问题,比如具体模型的量级,提升了多少,和哪些方法做了比较等。因为是自己的工作,所以没有卡壳。问有没有遇到过 Python 文件之间互相 import 的问题,出现这种问题怎么办?让我简单介绍了一下 PPO 算法,以及和 TRPO 的区别是什么?接着 PPO,问了一下 ChatGPT 的 RLHF 流程,以及为什么不直接用 SFT,而是要用强化这么麻烦的方式训练模型?继续追问 RLHF、SFT、LoRA 的区别,分别适用于什么场景?反问:公司现有业务是什么,计算资源情况等。二面:主管面论文介绍。让我用通俗的语言介绍我自己发表和投稿的论文,重点是研究动机和要解决的问题。问有没有亲手训练过大模型,最多用了多少张 GPU 卡?并行训练使用的框架是什么?介绍一下 DeepSpeed,说一下这个框架在并行的不同阶段(ZeRO stage)分别做了哪些事?训练模型的时候,数据量有多少,怎么收集数据的,训练花了多少时间?遇到的最大问题是什么?问在大模型全量微调时,显存消耗分别由哪些部分占用?(参数、梯度、优化器状态、激活信息等),分别占用多少?假设模型参数量为N,请分不同情况讨论和计算一下微调所需要的显存(不同精度、batch size、seq len 等)。说一下 LoRA 公式,讲一讲其中 A 和 B 两个矩阵分别表示什么。LoRA 的优缺点是什么,什么场景下适合使用?问知道哪些大模型训练和推理框架,用过哪些?问 LLaVA 的结构是什么,和常规的纯文本大模型有什么区别?Encoder-Decoder 结构的模型转 ONNX 的一般流程,遇到不支持的算子怎么办?可能遇到的问题(动态 shape、模型中逻辑判断需要单独写、模块拆分等)。三面:HR 面主要问了为什么选择公司,对团队的看法,对岗位的认识;未来大致的规划,面试过程的体验,有没有别的公司的 offer 等。以及询问了期望薪资等。之后就是等待,最终和期望薪资基本一致。总体感受面试流程比较顺畅,问题也比较贴合岗位要求;如果和岗位匹配度高,一般流程推进速度会很快。入职以后,工作内容和面试被问的问题也差不多,基本上都是算法工程师需要做的内容,团队氛围也很不错。只是毕竟是企业,不可能光搞研究,在承接业务时还是免不了和很多人打交道和来回battle需求,这个无可避免。
查看19道真题和解析
点赞 评论 收藏
分享
评论
38
155
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务