职位多多,欢迎大家发简历给我跨境搜索推荐-大模型Infra...(T021461)技术类上海若干岗位职责1、负责实现和优化大模型分布式训练以及在线推理系统,提升训练效率和推理性能,包括不限于:架构设计、算子开发、数据处理加速、Checkpoint保存与加载、通信优化等;2、研究和优化大规模异构加速集群调度、存储、通信互联、监控、Profiling等组件,提升整体硬件利用效率;3、研究并实现各种模型并行策略(DP/TP/PP/EP/CP)、混合精度、Zero、FSDP、MOE、FP8等技术,加速模型训练,优化显存开销;4、设计和开发高效的离线、在线推理系统,优化TensorRT-LLM、ONNX-Runtime、vLLM等推理框架,加速整体推理性能;任职要求1、本科及以上学历,具有扎实的计算机基础,熟悉操作系统和网络,熟悉C/C++和Python编程语言,对数据结构&算法设计有较深刻的理解;2、熟悉至少一种主流的深度学习框架,如Tensorflow或Pytorch;熟悉至少一种主流的模型推理框架,如TensorRT-LLM;3、熟悉CUDA编程,掌握TensorRT、Cutlass、cuDNN等加速库,有内核级优化经验者优先;4、具备大型分布式系统开发经验,熟悉MPI、NCCL、Megatron-LM、Deepspeed、FSDP等相关技术;5、责任心强,思路清晰,技术视野开阔,对业界新技术敏感,喜欢钻研,具有良好的学习能力并注重团队合作;加分项1、有大规模的大模型训练和推理优化经验者优先;2、熟悉算子开发,有算子优化(如CUDA/Triton)经验者优先;3、熟悉大模型算法设计,熟悉Transformer架构及其优化方法(如FlashAttention、PagedAttention)者优先;4、了解Kubernetes以及分布式存储,有相关开发经验者优先;5、有大型互联网系统(如搜索、推荐、广告)开发经验者优先;6、有发表OSDI/MLSys等顶会论文,或ACM/ICPC等编程比赛获奖经历者优先;跨境搜索推荐-大模型算法工程师(T021370)技术类上海若干岗位职责1、构建电商领域的大模型基座模型,持续优化预训练、后训练算法,利用RAG、Long Context、RL、多模态等技术,提升模型的理解、推理能力;2、针对大模型Reasoning、Perception等多个方向,研究以RL算法为核心的训练范式,持续探索RL算法的scaling和泛化能力;3、设计和开发、优化由大模型驱动的电商业务Agent,利用RL等技术,提升Agent的规划、推理能力;4、使用大模型/多模态大模型技术,改进用户行为理解、商品检索、商品排序、商品创意生成、商品内容理解等环节的效率,提升用户体验和系统智能化水平;5、设计和实施大模型算法评估框架,对模型性能进行监测和评估,并根据结果进行模型调优,确保系统的稳定性和可靠性;6、与产品团队、工程团队和数据团队等紧密合作,理解业务需求,制定并实施相应的算法解决方案;7、持续学习与创新。跟踪最新的大模型研究进展,不断学习新技术和算法,将最新的科研成果应用到实际业务中,提升用户体验和用户留存;任职要求1、有良好的数据分析和挖掘能力,熟练使用数据分析工具和编程语言,有良好的团队协作和沟通能力;2、对新技术和算法有强烈的学习欲望,能够快速适应工作中的挑战;3、熟悉大模型的训练和微调流程、Prompt Engineering等,熟悉相关训练和部署工具的使用如Transformers、DeepSpeed、Megatron-LM等;4、熟悉深度学习框架,如TensorFlow、PyTorch等,熟悉大模型的开发和优化;加分项1、有发表NeurIPS/CVPR等顶会论文,或ACM/ICPC等编程比赛获奖经历者优先;2、有大规模的大模型/多模态大模型训练和算法优化经验者优先;3、熟悉分布式训练、熟悉硬件架构、能针对硬件特性设计高效的算法方案者优先;4、熟悉Transformer架构及其改进、优化方法者优先;5、有大型互联网系统(如搜索、推荐、广告)算法优化经验者优先;跨境搜索推荐-机器学习架构工程...(T020466)技术类上海若干岗位职责1、优化深度学习在线推理服务框架,包括架构设计、系统研发、性能优化,保障模型推理性能与部署效率;2、优化深度学习模型训练框架,包括不限于CPU的稀疏训练框架、Dense模型训练加速以及离线模型推理优化,保障模型训练的稳定与高效;3、优化机器学习计算平台,负责构建一站式机器学习解决方案,涵盖从数据集管理、模型训练、模型优化、模型上线以及分布式计算全流程。任职要求1、本科及以上学历,具有扎实的计算机基础, 熟悉操作系统和网络, 精通C/C++和Python编程语言, 对数据结构&算法设计有较深刻的理解;2、精通至少一种主流的深度学习框架,如Tensorflow或Pytorch;3、精通至少一种主流的模型推理框架,如onnxruntime;4、责任心强,思路清晰,技术视野开阔,对业界新技术敏感,喜欢钻研,具有良好的学习能力并注重团队合作;加分项1、有大模型调优经验者优先;2、熟悉算子开发经验者优先;3、熟悉分布式训练框架者优先,了解Parameter Server架构,了解底层通信库,比如MPI或brpc;5、了解Kubernetes,有相关开发经验者优先;6、有大型互联网系统(广告、搜索、推荐)经验者优先;跨境电商-广告后端开发工程师(T021153)技术类上海若干岗位职责1、负责跨境电商广告搜索、推荐引擎后台服务架构设计,打造高性能、高可用、可扩展的架构,支撑广告业务快速发展;2、负责跨境电商广告业务系统,包括:商家平台/投放中台/运营平台/计费平台/实时大数据平台的开发;3、负责跨境电商广告系统全链路研发和优化, 包括BC端后端服务架构,以及广告索引库、广告检索服务、服务框架、资源管控等模块设计和开发,提高系统性能和扩展性;4、深刻理解广告业务,抽象和设计合理的技术架构,保证架构的合理性和前瞻性,以适应不断变化的需求;5、持续优化系统设计,提升系统的性能、可用性、稳定性与可扩展性;任职要求1、具有扎实的计算机基础,熟悉操作系统和网络,精通C/C++或者JAVA任一语言, 对数据结构&算法设计有较深刻的理解;2、有良好的沟通和逻辑思维能力,有足够的技术和业务好奇心,善于学习,善于分析和解决实际问题;3、责任心强,思路清晰,技术视野开阔,对业界新技术敏感,喜欢钻研,具有良好的学习能力并注重团队合作;加分项1、有海外电商经验者优先,熟悉多国家、多语言环境下的架构设计者优先;2、大型互联网系统(广告、搜索、推荐)开发经验者优先;3、熟悉分布式计算、存储、机器学习系统,熟悉流式计算框架,有流式计算开发经验者优先;#大模型算法工程师##infra##后端开发工程师[话题]##社招##校招#