面试手搓深度模型加梯度回传不用框架

面试最后,面试官让我不用框架手搓lstm,好像还要梯度回传,我忘了lstm公式了,让我简单搓个mlp,我才勉强搓出来
我以为会让我做leetcode题
算法岗的实习面试强度这么高的吗😂
全部评论
很正常吧,我被要求手撕BERT和Attention好多次了
点赞 回复 分享
发布于 2023-12-10 14:06 上海

相关推荐

1.介绍一下transformer架构,它解决了rnn和cnn哪些无法解决的问题?2.怎么理解词与词之间距离的概念?为什么大模型需要知道这个距离?3.transformer的核心机制是什么?能不能用一个具体的例子串一遍里面所有概念?4.你提到的QKV能不能具体讲一下?它的核心作用是什么?5.模型层叠加之后会出现什么问题?我们要引入什么机制去解决这个问题?6.传统的残差机制会有什么问题?现在业界有没有提出一些新的解决方案?7.现在业界有很多先进的大模型,有些是7b,有些是325b,这个b的概念是什么?我们在做模型选择的时候怎么选?8.对于不同的细分领域,能不能讲一下你对现有的模型厂商他们参数量选型的了解?9.现在给你一个场景,比如说我们做ai coding,你会怎么去选择参数量?10.对话型模型和推理型模型之间的区别是什么?分别适用于什么样的场景?11.简要的介绍一下engine、sub engine、skill、mcp这几个概念,他们的用途是什么?在代码开发过程中分别用来解决什么问题?12.在开发过程中,多轮迭代会话后工程越来越难以维护,你有没有什么好的建议?13.对于上下文工程的最佳实践,常用到的一些技术或者解决方案都有哪些?14.目前这个体系还很复杂,有没有现成的东西来辅助我?有没有了解现在开源社区很火的一些解决方案?15.聊一下实习期间你遇到最困难的一件事,这件事你是怎么解决的?得到了一个什么样的效果或结果?📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看15道真题和解析
点赞 评论 收藏
分享
评论
4
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务