鹅厂LLM算法 日常实习一面
攒人品中,祝大家都能拿到满意的Offer!
1.项目介绍
2.知识蒸馏,软硬标签怎么提,loss怎么算
3.lora和qlora
4.deepspeed
5.模型显存占用估算
6.训练加速模块,如flash attention
7.vllm为什么更快
8.挑个大模型介绍下
9.为什么GQA好
10.加lora计算量怎么变化
11.强化学习框架
12.kl散度
13.手撕:lora,经典接雨水
1.项目介绍
2.知识蒸馏,软硬标签怎么提,loss怎么算
3.lora和qlora
4.deepspeed
5.模型显存占用估算
6.训练加速模块,如flash attention
7.vllm为什么更快
8.挑个大模型介绍下
9.为什么GQA好
10.加lora计算量怎么变化
11.强化学习框架
12.kl散度
13.手撕:lora,经典接雨水
全部评论
相关推荐
05-06 14:46
河南科技大学 前端工程师 点赞 评论 收藏
分享
04-29 12:45
内蒙古大学创业学院 C++ bangbangba...:感觉三个项目可以融在一起,比如上层是用手写的epoll,然后到tcp聊天层,然后你写了一个后台监控(不过我也不懂c++,但是感觉写一个大项目比三个小项目要好)
点赞 评论 收藏
分享
03-14 18:30
华侨大学 Java 牛客20485985...:没关系的吧,我也是双飞大二,有过很多约面。海投呗,我觉得介意大二的不是很多。你的项目没毛病。建议看一看agent
点赞 评论 收藏
分享
