微信大模型训练研发工程师(工程 Infra工作) 秋招继续哈 欢迎投递~~~

微信大模型训练研发工程师(工程 Infra工作)
岗位职责:
1.参与开发优化大模型训练框架,支持大规模高效稳定训练;
2.参与大模型结构设计,并联合业务进行模型训练效率和效果验证。

base北京, 校招 or日常实习都可
备注训练框架jd。********** 或者发简历到lucasbai@tencent.com
岗位要求:
1.熟练使用PyTorch框架,可对DDP训练的代码进行性能分析和优化;
2.熟练使用主流大模型训练框架DeepSpeed、Megatron,掌握3D并行、ZeRO机制、Flash-Attn等的原理、使用场景、优劣势以及可优化方向;
3.熟练掌握CUDA性能优化手段,有算子编写优化项目经验者优先;
4.对大模型前沿技术比较敏锐者优先;5.有实际大模型的训练调参和效果评测项目经验的优先;6.良好的沟通能力、解决问题能力。
全部评论

相关推荐

12-10 18:25
门头沟学院 Java
1、实习介绍2、现在还在实习吗?3、对岗位有什么了解?4、正式工作是想投测开,还是其它岗位?5、腾讯实习应该是做纯开发吧?6、最开始为什么会选择开发呢?7、C++ 和 Go 有什么区别?8、实习期间遇到最大的挑战是什么?9、实习项目为什么没有选择其它编程语言呢?是你的 Mentor 来决定的吗?10、你写了 300 多篇的技术博客,是什么契机让你这么做的?10、因为你没有做过机器人相关的,那说一下你知道的,或者是现在有用过哪些 AI 相关的产品吗?11、文生图这些工具知道吗?12、我们是一个工程机械的产品,可以跟你讲一下这个是怎么工作的,你可以站在测试的角度先说一下你的理解13、自动装车的一个场景:有一台挖掘机,在它某个方位上可能有个卡车。功能:自动装车挖掘机会自动识别到哪个地方可以挖,挖完之后就会自动识别到卡车,把土倒到卡车上这样一个动作。讲一下里面可能涉及到的技术14、有使用过 DeepSeek 吗,有用它来做一些编程吗?15、Claude 在外测之前会去做一些测试。假如你是 Claude 测试开发同学,你要怎么去测这个 Claude 模型?16、从功能角度上怎么去验证?17、你会如何使用工具来提高 Claude 模型的测试效率?18、你觉得用例会有多少?19、算法题:小红的子串删除她准备删除其中一个连续子串,把剩下的前缀以及后缀拼接起来,拼接后的字符串中出现次数最多的字母的出现次数不超过 k。小红想知道,有多少种不同的删除方案?删除方案所删除子串的长度 len 必须满足 1 ≤ len ≤ n - 1,其中 n 为原字符串长度。输入描述:- 第一行输入两个正整数 n 和 k,分别代表字符串长度、需要保证的字母最大出现次数。- 第二行输入一个长度为 n 的字符串,只包含小写字母。输出描述:一个整数,代表总方案数。20、手上有拿到 其它实习和秋招的 offer 吗?都是什么岗位?
查看20道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务