某小厂大模型算法实习一面
最近空下来了写点面经攒下人品...
1.项目拷打为主,问的非常细
2.针对全流程问了各个环节的badcase,占比如何,重点解决哪部分
3.以一个具体的badcase为例,讲讲如何思考、如何解决的
4.数据分别怎么样,泛化性如何考虑
5.大模型如果出错怎么办,是否有相关的处理机制
6.对AIGC本身了解有多少,例如绘图、生成视频
7.对于加班这件事怎么看
8.你的文章思路是怎么来的
9.针对文章背景的这个问题,业内主流思路与你们的差异
10.介绍消融实验是怎么做的
11.PPO损失函数是什么样的
12.GRPO相比于PPO的改进点
1.项目拷打为主,问的非常细
2.针对全流程问了各个环节的badcase,占比如何,重点解决哪部分
3.以一个具体的badcase为例,讲讲如何思考、如何解决的
4.数据分别怎么样,泛化性如何考虑
5.大模型如果出错怎么办,是否有相关的处理机制
6.对AIGC本身了解有多少,例如绘图、生成视频
7.对于加班这件事怎么看
8.你的文章思路是怎么来的
9.针对文章背景的这个问题,业内主流思路与你们的差异
10.介绍消融实验是怎么做的
11.PPO损失函数是什么样的
12.GRPO相比于PPO的改进点
全部评论
相关推荐
烤点老白薯:测测你的
点赞 评论 收藏
分享
八股战士0offer:虽然但是,你想表达的应该是学习如何agent工程里的提示词工程,而不是训练或者微调模型,这基本上是两个不同的方向。我认为学习agent主要就两个东西:提示词工程和上下文工程。像你说的prompt caching这种优化怎么能想到,建议多读大模型供应商尤其是anthropic的博客,anthropic大概一年前就有很详细的博客讲最佳实践和实现了 
点赞 评论 收藏
分享
