算法面经1:大模型 金融大哥同花顺

9.1 同花顺 大模型(2+1)🚀
主要是以项目为主,掺杂八股,八股具体如下(忘记顺序是什么样子):
1. Transformer的自注意力机制及相比RNN的优势?
2. 自注意力计算中为何除以 $$\sqrt{d_k} $$?
3. 现在LLM微调的方式有哪些? 再问Adapter和Lora的区别?
4. LLM的架构有哪些?现在使用的是那种?为什么?
5. Prefix LM与Causal LM区别?
6. RLHF流程? 当时不太懂,没深问,现在需要多了解
7. 如何优化大模型训练速度?
8. 跨模态对齐你是如何做的?Q-Former与MLP适配器的优劣。
9. LLM训练中遇到Loss突增如何解决?

#实习# #秋招# #大模型# #nlp# #金融# #算法# #八股#
全部评论
老哥方便问一下进去实习体验怎么样啊
点赞 回复 分享
发布于 10-19 22:03 浙江
有手撕吗
点赞 回复 分享
发布于 03-16 21:14 湖北
老哥!请问实习是面几轮呀
点赞 回复 分享
发布于 03-16 19:28 上海

相关推荐

12-07 10:09
复旦大学 Java
点赞 评论 收藏
分享
11-03 13:18
门头沟学院 Java
我要娶个什么名:nb 25年这种都能做到真的硬实力够猛
字节跳动工作体验
点赞 评论 收藏
分享
评论
11
43
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务