快手实习

感兴趣的可以发一份简历:******** **********

AI Infra研发工程师【实习生】- 杭州/北京
推荐链接:https://neitui.corp.kuaishou.com/#/internal/job-info/23984/ 

职位描述:
1. 负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率;
2. 负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本;
3. 基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作;
4. 持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向;
5. 大模型应用开发,包括prompt、rag、长记忆、agent等

任职要求:
1. 本科及以上学历,计算机相关专业;
2. 掌握常用数据结构与算法,具备扎实的编程基础和良好的编码习惯;
3. 熟悉至少一种编程语言(如 Golang、Java、Python 等); 
4. 有 Docker、Kubernetes、vLLM、SGLang、RouteLLM 等技术的学习或实践经验者优先,参与过开源项目更佳;  
5. 积极主动,自驱力强,具备良好的团队合作精神和解决问题的能力;  
6. 对如下一个或多个领域有浓厚的兴趣,并愿意付出自己的时间进行深入研究和探索:
a. 机器学习框架:PyTorch、TensorFlow等机器学习框架、GPU等异构计算芯片及优化、MLOps、CV/NLP/搜广推等领域模型算法等;
b. 云原生:Kubernetes及容器系统、大规模训练任务和推理服务编排和调度、镜像加速等;  

全部评论
感兴趣的同学直接私聊我吧
点赞 回复 分享
发布于 07-28 18:11 北京

相关推荐

常见的业务题架构理解篇Q1 Transformer模型主要由哪两部分组成?Q2 自注意力机制中的Q、K、V矩阵是什么缩写?Q3 多头注意力中"头"(head)指的是什么?Q4 位置编码的作用是什么?Q5 Encoder和Decoder结构的主要区别?Q6 为什么要使用残差连接(Residual Connection)?基础组件篇Q7 前馈神经网络(FFN)有多少层?Q8 Layer Normalization放在哪个位置?Q9 激活函数ReLU和GeLU的主要区别?Q10 词嵌入(Word Embedding)的维度代表什么?Q11 注意力掩码(Attention Mask)的作用是什么?Q12 为什么要使用dropout技术?训练基础篇Q13 预训练(Pre-training)的目标是什么?Q14 什么是语言模型中的"自回归生成"?Q15 数据并行的基本实现方式?Q16 什么是训练中的批量大小(Batch Size)?Q17 学习率(Learning Rate)过大会导致什么问题?Q18 训练损失(Training Loss)下降说明什么?模型应用篇Q19 什么是文本生成中的贪心解码(Greedy Decoding)?Q20 温度参数(Temperature)如何影响生成结果?Q21 模型推理时为什么要限制生成长度?基础概念篇Q25 参数量(Parameters)和计算量(FLOPs)的区别?Q26 什么是生成式AI(Generative AI)?Q27 预训练模型和传统NLP模型的核心区别?Q28 为什么大模型需要海量训练数据?Q29 什么是过拟合(Overfitting)现象?Q30 模型推理(Inference)是指什么过程?工程实践篇Q31 GPU显存不足时常见的解决方法?Q32 模型权重文件(Checkpoint)包含哪些内容?评估基础篇Q37 如何评估语言模型的生成质量?Q38 困惑度(Perplexity)指标的计算原理?
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务