【出海电商】大模型算法工程师
社招JD,坐标上海,欢迎大佬咨询
大模型算法工程师
岗位职责
1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地业务。持续建设和优化NLP/LLM/CV/多模态模型预训练算法,利用RAG、Long Context、RLHF、COT等技术,提升模型的理解、推理能力;
2、负责设计、开发和优化电商领域的自然语言处理(NLP)算法,提高搜索、推荐系统的性能和效果;
3、使用NLP/LLM/CV/多模态大模型,对搜索推荐全链路进行算法优化,改进商品创意生成、理解用户行为、理解商品内容等,以提升用户体验和系统智能化水平;
4、大模型评估与调优:设计和实施算法评估框架,对模型性能进行监测和评估,并根据结果进行模型调优,确保系统的稳定性和可靠性;
5、跨团队协作:与产品团队、工程团队和数据团队等紧密合作,理解业务需求,制定并实施相应的算法解决方案;
6、持续学习与创新:跟踪最新的NLP/LLM/CV/多模态大模型研究进展,不断学习新技术和算法,将最新的科研成果应用到实际工程中,保持团队的竞争力;
任职要求
1、有良好的数据分析和挖掘能力,熟练使用数据分析工具和编程语言,有良好的团队协作和沟通能力优先;
2、对新技术和算法有强烈的学习欲望,能够快速适应工作中的挑战;
3、熟悉主流大模型的训练和微调流程、Prompt Engineering等,熟悉相关训练和部署工具的使用如Transformers、DeepSpeed、Megatron-LM等;
4、熟悉深度学习框架,如TensorFlow、PyTorch等,熟悉大模型的开发和优化。
大模型算法工程师
岗位职责:
1、构建电商领域的大模型基座模型,持续优化预训练、后训练算法,利用RAG、Long Context、RL、多模态等技术,提升模型的理解、推理能力;
2、针对大模型Reasoning、Perception等多个方向,研究以RL算法为核心的训练范式,持续探索RL算法的scaling和泛化能力;
3、设计和开发、优化由大模型驱动的电商业务Agent,利用RL等技术,提升Agent的规划、推理能力;
4、使用大模型/多模态大模型技术,改进用户行为理解、商品检索、商品排序、商品创意生成、商品内容理解等环节的效率,提升用户体验和系统智能化水平;
5、设计和实施大模型算法评估框架,对模型性能进行监测和评估,并根据结果进行模型调优,确保系统的稳定性和可靠性;
6、与产品团队、工程团队和数据团队等紧密合作,理解业务需求,制定并实施相应的算法解决方案;
7、持续学习与创新。跟踪最新的大模型研究进展,不断学习新技术和算法,将最新的科研成果应用到实际业务中,提升用户体验和用户留存;
任职要求:
1、有良好的数据分析和挖掘能力,熟练使用数据分析工具和编程语言,有良好的团队协作和沟通能力;
2、对新技术和算法有强烈的学习欲望,能够快速适应工作中的挑战;
3、熟悉大模型的训练和微调流程、Prompt Engineering等,熟悉相关训练和部署工具的使用如Transformers、DeepSpeed、Megatron-LM等;
4、熟悉深度学习框架,如TensorFlow、PyTorch等,熟悉大模型的开发和优化;
大模型Infra架构工程师
岗位职责:
1、负责实现和优化大模型分布式训练以及在线推理系统,提升训练效率和推理性能,包括不限于:架构设计、算子开发、数据处理加速、Checkpoint保存与加载、通信优化等;
2、研究和优化大规模异构加速集群调度、存储、通信互联、监控、Profiling等组件,提升整体硬件利用效率;
3、研究并实现各种模型并行策略(DP/TP/PP/EP/CP)、混合精度、Zero、FSDP、MOE、FP8等技术,加速模型训练,优化显存开销;
4、设计和开发高效的离线、在线推理系统,优化TensorRT-LLM、ONNX-Runtime、vLLM等推理框架,加速整体推理性能;
任职要求:
1、本科及以上学历,具有扎实的计算机基础,熟悉操作系统和网络,熟悉C/C++和Python编程语言,对数据结构&算法设计有较深刻的理解;
2、熟悉至少一种主流的深度学习框架,如Tensorflow或Pytorch;熟悉至少一种主流的模型推理框架,如TensorRT-LLM;
3、熟悉CUDA编程,掌握TensorRT、Cutlass、cuDNN等加速库,有内核级优化经验者优先;
4、具备大型分布式系统开发经验,熟悉MPI、NCCL、Megatron-LM、Deepspeed、FSDP等相关技术;
5、责任心强,思路清晰,技术视野开阔,对业界新技术敏感,喜欢钻研,具有良好的学习能力并注重团队合作;
大模型算法工程师
岗位职责
1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地业务。持续建设和优化NLP/LLM/CV/多模态模型预训练算法,利用RAG、Long Context、RLHF、COT等技术,提升模型的理解、推理能力;
2、负责设计、开发和优化电商领域的自然语言处理(NLP)算法,提高搜索、推荐系统的性能和效果;
3、使用NLP/LLM/CV/多模态大模型,对搜索推荐全链路进行算法优化,改进商品创意生成、理解用户行为、理解商品内容等,以提升用户体验和系统智能化水平;
4、大模型评估与调优:设计和实施算法评估框架,对模型性能进行监测和评估,并根据结果进行模型调优,确保系统的稳定性和可靠性;
5、跨团队协作:与产品团队、工程团队和数据团队等紧密合作,理解业务需求,制定并实施相应的算法解决方案;
6、持续学习与创新:跟踪最新的NLP/LLM/CV/多模态大模型研究进展,不断学习新技术和算法,将最新的科研成果应用到实际工程中,保持团队的竞争力;
任职要求
1、有良好的数据分析和挖掘能力,熟练使用数据分析工具和编程语言,有良好的团队协作和沟通能力优先;
2、对新技术和算法有强烈的学习欲望,能够快速适应工作中的挑战;
3、熟悉主流大模型的训练和微调流程、Prompt Engineering等,熟悉相关训练和部署工具的使用如Transformers、DeepSpeed、Megatron-LM等;
4、熟悉深度学习框架,如TensorFlow、PyTorch等,熟悉大模型的开发和优化。
大模型算法工程师
岗位职责:
1、构建电商领域的大模型基座模型,持续优化预训练、后训练算法,利用RAG、Long Context、RL、多模态等技术,提升模型的理解、推理能力;
2、针对大模型Reasoning、Perception等多个方向,研究以RL算法为核心的训练范式,持续探索RL算法的scaling和泛化能力;
3、设计和开发、优化由大模型驱动的电商业务Agent,利用RL等技术,提升Agent的规划、推理能力;
4、使用大模型/多模态大模型技术,改进用户行为理解、商品检索、商品排序、商品创意生成、商品内容理解等环节的效率,提升用户体验和系统智能化水平;
5、设计和实施大模型算法评估框架,对模型性能进行监测和评估,并根据结果进行模型调优,确保系统的稳定性和可靠性;
6、与产品团队、工程团队和数据团队等紧密合作,理解业务需求,制定并实施相应的算法解决方案;
7、持续学习与创新。跟踪最新的大模型研究进展,不断学习新技术和算法,将最新的科研成果应用到实际业务中,提升用户体验和用户留存;
任职要求:
1、有良好的数据分析和挖掘能力,熟练使用数据分析工具和编程语言,有良好的团队协作和沟通能力;
2、对新技术和算法有强烈的学习欲望,能够快速适应工作中的挑战;
3、熟悉大模型的训练和微调流程、Prompt Engineering等,熟悉相关训练和部署工具的使用如Transformers、DeepSpeed、Megatron-LM等;
4、熟悉深度学习框架,如TensorFlow、PyTorch等,熟悉大模型的开发和优化;
大模型Infra架构工程师
岗位职责:
1、负责实现和优化大模型分布式训练以及在线推理系统,提升训练效率和推理性能,包括不限于:架构设计、算子开发、数据处理加速、Checkpoint保存与加载、通信优化等;
2、研究和优化大规模异构加速集群调度、存储、通信互联、监控、Profiling等组件,提升整体硬件利用效率;
3、研究并实现各种模型并行策略(DP/TP/PP/EP/CP)、混合精度、Zero、FSDP、MOE、FP8等技术,加速模型训练,优化显存开销;
4、设计和开发高效的离线、在线推理系统,优化TensorRT-LLM、ONNX-Runtime、vLLM等推理框架,加速整体推理性能;
任职要求:
1、本科及以上学历,具有扎实的计算机基础,熟悉操作系统和网络,熟悉C/C++和Python编程语言,对数据结构&算法设计有较深刻的理解;
2、熟悉至少一种主流的深度学习框架,如Tensorflow或Pytorch;熟悉至少一种主流的模型推理框架,如TensorRT-LLM;
3、熟悉CUDA编程,掌握TensorRT、Cutlass、cuDNN等加速库,有内核级优化经验者优先;
4、具备大型分布式系统开发经验,熟悉MPI、NCCL、Megatron-LM、Deepspeed、FSDP等相关技术;
5、责任心强,思路清晰,技术视野开阔,对业界新技术敏感,喜欢钻研,具有良好的学习能力并注重团队合作;
全部评论
相关推荐
投票
点赞 评论 收藏
分享
查看9道真题和解析