巨人网络大模型实习(2025.01.03)

1、自我介绍
2、项目介绍
3、知道国内哪些大模型
4、说一下通义千文的架构(不会)
5、那说一下chatglm3的架构
6、嵌入层(Embedding Layer) 和 输出层(Output Layer) 是参数共享的吗?
7、用的是什么归一化(Layer Normalization?)有哪些实现方式?
8、分布式训练了解吗,deepspeed?
8、了解RHLF吗?有哪几个模型?怎么计算loss的?
9、JAE了解吗?(不知道有没有听错,我好像都没停过这个东西
10、还了解其他的对齐技术吗?

还的练,挺基础的,自己太菜。
全部评论
chatglm3架构详解
点赞 回复 分享
发布于 2025-07-14 16:39 上海

相关推荐

程序员花海:实习和校招简历正确格式应该是教育背景+实习+项目经历+个人评价 其中项目经历注意要体现业务 实习经历里面的业务更是要自圆其说 简历模板尽可能保持干净整洁 不要太花哨的
点赞 评论 收藏
分享
评论
3
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务