大模型面经(第一期)

因为又被运营约稿了,然后也老被催更新,

所以趁着放假就更新一下,这篇就写怎么去面试,怎么去准备大模型吧,

这里也很有意思,这个牛客网在boss上来要我简历了,后面加了微信不过他们只要2-4年的资深大模型工程师。

那么直接开始吧,本来打算早点更新的,不过嘛,下班之后一直在打游戏,对此只能说三角洲太好玩了,琳琅天上还是当年模样,

好玩,想起小学时代玩的qq飞车了(时代眼泪了算是,现在人估计都没听过这个游戏了何况会去玩呢,真怀念那会边听歌边跑图)

一晃便过去一个时代,这时间若白驹过隙,所以啊,诸君当是要珍惜时间和家人,不要太看重工作。

先随便讲点吸引大伙注意力,那么直接开始今天的教程。

先叠甲:以下的问题,基本上都是我面试面出来的,很可能跟你理解的会有出入,或者会让你感到惊讶。

5.6(无实习):

面试刚开始的时候:

一家小厂:

先做个自我介绍(一般上都有这么个流程,大伙尽量简短,然后要说明自己已经介绍完了,着重说明优势在哪里,我开局就说我有两年开发经验,然后一般人家就会开始问了)

你觉得agent是什么?

你有没有什么常用的ai?

你知道GPT和BERT的区别是什么吗?(就语言推理和双向模型,具体自个去看,这里先做总结,毕竟篇幅有限难以面面俱到)

请问cot是什么?

请问function call现在用在那里?(就上下文召回和函数调用)

问了下我的项目,你自己研究的模型?

我说整体架构我做的,调用的是deepseek-r1-7b这个,

为什么用这个?

废话,电脑只能带的动这个,qwen3-32B下载下来都要400多G,何况跑起来。

请问整体模型微调步骤是什么?

请问deepspeed-Zero是什么?(加速推理的东西,自己去看)

两天后oc,

一家远程:

先自我介绍。。。。。。

首先给我来了一手小小的面试官自我介绍(就是接入LLM做了数据库,然后人在西海岸拉投资,西雅图的硅谷,并不是HK,大伙估计不知道有这么个区别,我讲清楚)

你知道ppo是什么吗?

请问RL和DPO的区别是什么?

请问megatron怎么用?

请问有没有用过云计算?

假如你加入我们可以干多久,然后是否熬夜对进度?(因为美国和中国存在时差)

你的agent怎么样?

用没用过fastapi?

你觉得和spring的tomcat区别是什么?

为什么不考虑AWS?(原因很简单,要钱,懒得租人家的)

第二天上午oc,因为说了8月份才给工资原因是他们手上没钱,估计是8月份拿到投资给期权之类的,这懒得打白工加上手上几家offer直接不管他了。

一家中厂:

这里说清楚,如果公司让你去线下面试,直接问能不能远程线上面试,不行就不去,真给他脸了,你来回要时间,万一挂了也难受,

这些人就故意恶心人的,我操tm的开个腾讯会议都不愿意这家公司你去了也干的不顺心懂吗。

问了学习的方向,我说专业分流到人工智能方向,

问了cnn,RNN是什么(卷积神经网络,和随机神经网络,去搜网课看看就行,他考的基本都不难就知道这个怎么算的就行了)

然后介绍了公司干什么,一家做金融,估摸着是外包,然后去了可以学债券金融之类的,然后可以给证券公司内推之类的。

不用管,这些钱才是真的,工资没人家高,150一天,boss看着100到499个人,完事还在广州不考虑这家。

然后问了场景题,你现在想做一个评论搜集的功能你要怎么做?(就是控评,我说了怎么洗数据,怎么采样,然后权重比,然后加个关键字过滤之类的)

然后问你项目里面怎么做到把90%的准确率的,我直接实话实说,想让简历更好看点所以就写了个这个,实际上测了40轮,大概准确到36轮左右。

那个hr直接认可坦率与真诚哈哈哈。

第三天上午发了offer。

那么这期先写到这里了,先吃饭先。这里再推荐一首Por Una Cabeza跳舞的小曲~。可以去听听看,最后希望这首歌能给你带来好心情。后面还会写面经,大伙点个关注先,想看随时可以看到,然后想要路线的,直接私信我就行,最近又更新了一版学习路线。

#牛客激励计划##牛友故事会##创作激励计划##牛客创作赏金赛##面试经验谈#
全部评论
这是找实习啊
点赞 回复 分享
发布于 06-03 15:51 河南
现场面试这种公司纯恶心人,从来没去过,来回的时间成本+面试等待时间成本+不确定性,一个会议明明就可以解决面试问题+代码考察非要现场面试,这样的公司纯cs
点赞 回复 分享
发布于 06-03 15:38 北京
点赞 回复 分享
发布于 06-03 13:32 北京
佬,膜拜了
点赞 回复 分享
发布于 06-03 11:49 北京
楼主面了多少家呀
点赞 回复 分享
发布于 06-03 10:08 广东
这是真佬
点赞 回复 分享
发布于 06-03 10:07 山东
MARK
点赞 回复 分享
发布于 06-01 23:40 广东

相关推荐

1.请简述什么是大模型,以及它与传统模型的主要区别是什么?2.你如何评估大模型的性能?有哪些常用的评估指标?3.请描述一下你如何对大模型进行优化,以提高其性能和效率。4.你是否有过使用或开发大模型的经验?请分享一个具体的案例。5.大模型中的注意力机制是如何工作的?它在大模型中起到了什么作用?6.大模型中的优化算法有哪些常见的选择?它们各有什么优缺点?7.如何处理大模型训练过程中的梯度消失或梯度爆炸问题?8.在大模型设计中,如何权衡模型的复杂度和性能?9.面对大模型训练和推理所需的庞大计算资源,你有什么解决建议?10.请简述你了解的大模型的主要结构特点。11.reward bench上的reward model分哪几类?12. reward model如何训练的,训练目标是什么?13.dp0训练的损失函数和训练目标,dpo如何改进怎么理解大模型安全,包含哪些方面的内容?14.指令跟随能力的评估集有什么,如何评估的?15.阿尔法狗强化学习策略是什么?提升推理能力和指令跟随能力哪个更难, 为什么, 提升指令跟随能力的优化方式和其他的比如推理有什么不一样的地方?16.dpo训完了一般输出长度会变化吗? 如何解决这个问题大模型训练过程学习率一般是怎么变化的, 退火阶段学习率如何变化的?17.在开发大模型时,当你面临推理阶段的资源需求时,你如何确保模型的可解释性和公平性?18.谈谈你对Transformer模型的理解,以及它在自然语言处理中的应用。19.请简述Transformer的基本结构和工作原理?20.为什么Transformer使用位置编码(Positional Encoding)?21.如何优化 Transformer 模型的性能?22.Transformer在自然语言处理中有哪些应用?23.transformer里边norm的位置在哪里,norm如何计算的多头自注意力机制的作用是什么?24.注意力机制为什么除以根号dk, 为什么不是dk请解释什么是注意力机制,并举例说明其应用场景。25.注意力机制是如何工作的?请简述其计算过程。26.多头注意力机制是什么?它相比单头注意力有什么优势?📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看26道真题和解析
点赞 评论 收藏
分享
评论
25
25
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务