阿里大模型算法二面-实习面经

1. 目前多模态大语言模型是如何融合文本与图像信息的?
2. 大语言模型的RLHF训练流程是什么?它存在哪些潜在风险?
3. 什么是Embedding?词嵌入和句嵌入有何不同?
4. 大语言模型中的Tokenization是如何工作的?不同模型的分词算法有何差异?
5. 对比大语言模型的增量推理和传统推理方式,增量推理的优势和实现难点是什么?
6. 介绍一下大语言模型中的知识蒸馏,它如何用于压缩模型体积?
7. 过往项目(细节追问)
8. 大语言模型的长文本处理能力有限,目前有哪些技术可以缓解这一问题?
9. 什么是大语言模型的“上下文窗口”?扩展上下文窗口对模型性能有何影响?
全部评论

相关推荐

不愿透露姓名的神秘牛友
2025-12-19 10:45
秋招路在何方:少了啊,我身边都是350000k*18,发三体货币
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务