LLM字节大模型算法一面 猝不及防

1️⃣实习介绍
2️⃣基础知识问答——八股
1. 详细描述,如果给一个txt存储的文本,从预处理到SFT的训练流程,要包括对数据的预处理、tokenize、forward、loss计算、参数更新,越细越好
2. tokenizer怎么做的,有哪些tokenizer的实现方式
3. embedding怎么做的,从id到embedding有哪些实现方式
4. transformer八股
transformer的forward计算包含哪些部件
如何解决梯度消失和梯度爆炸的
非线性由什么来提供
3️⃣项目经历
1. 介绍自己最熟悉的一个项目,项目中做了什么
2. 一些对项目细节的提问
3. 这个项目的意义
4. 后续打算做什么
4️⃣手撕:用numpy,写MHA
5️⃣反问环节
全部评论

相关推荐

评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务