岗位关键词
岗位职责
1、主导AI大模型的量化应用和技术创新工作,负责大模型算法的深度研究、性能优化及规模化部署落地,推动大模型项目的全流程建模和技术实现; 2、深入研究和应用大语言模型的后训练、微调、SFT、RL等核心技术,主导大模型在量化方向的创新性应用和解决方案设计; 3、持续跟踪人工智能领域的前沿技术发展趋势,主导技术创新和研究工作,推动团队技术能力的提升; 4、探索并实现前沿大模型技术在算法项目中的创新应用,将最新研究成果转化为实际业务价值,推动技术成果的高效落地。
岗位要求
1、在LLM/多模态LLM模型领域有深厚的理论研究和实践经验,精通主流LLM/MLLM模型的设计原理和架构,具备大规模模型预训练、微调和推理的丰富经验; 2、具备扎实的机器学习/深度学习理论基础,精通PyTorch等深度学习框架,对其底层实现和优化有深刻理解;熟练掌握transformers、vllm、trl、deepspeed、megatron等多种大模型训练框架,并能进行定制化开发和性能优化; 3、具备优秀的学术背景,在AI顶会(如NeurIPS、ICML、CVPR等)或顶级期刊上有高质量论文发表者优先; 4、在大模型和量化双领域有深入研究和丰富实践经验,具备大模型在量化领域成功应用的案例或创新成果者优先; 5、具备较强的技术领导力和项目管理能力,能够独立承担技术攻关任务,推动团队技术目标的实现。
上海市浦东新区银城中路68号
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
上海念空私募基金管理合伙企业(有限合伙)
企业服务
未融资
上海市
查看其他 11 个职位