巨人网络大模型实习(2025.01.03)
1、自我介绍
2、项目介绍
3、知道国内哪些大模型
4、说一下通义千文的架构(不会)
5、那说一下chatglm3的架构
6、嵌入层(Embedding Layer) 和 输出层(Output Layer) 是参数共享的吗?
7、用的是什么归一化(Layer Normalization?)有哪些实现方式?
8、分布式训练了解吗,deepspeed?
8、了解RHLF吗?有哪几个模型?怎么计算loss的?
9、JAE了解吗?(不知道有没有听错,我好像都没停过这个东西
)
10、还了解其他的对齐技术吗?
还的练,挺基础的,自己太菜。
2、项目介绍
3、知道国内哪些大模型
4、说一下通义千文的架构(不会)
5、那说一下chatglm3的架构
6、嵌入层(Embedding Layer) 和 输出层(Output Layer) 是参数共享的吗?
7、用的是什么归一化(Layer Normalization?)有哪些实现方式?
8、分布式训练了解吗,deepspeed?
8、了解RHLF吗?有哪几个模型?怎么计算loss的?
9、JAE了解吗?(不知道有没有听错,我好像都没停过这个东西
10、还了解其他的对齐技术吗?
还的练,挺基础的,自己太菜。
全部评论
chatglm3架构详解
相关推荐
2025-12-09 23:27
商丘学院 嵌入式软件工程师
程序员花海:实习和校招简历正确格式应该是教育背景+实习+项目经历+个人评价 其中项目经历注意要体现业务 实习经历里面的业务更是要自圆其说 简历模板尽可能保持干净整洁 不要太花哨的 点赞 评论 收藏
分享
正浩创新EcoFlow公司福利 707人发布