【出海电商】大模型算法工程师

社招JD,坐标上海,欢迎大佬咨询

大模型算法工程师
岗位职责
1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地业务。持续建设和优化NLP/LLM/CV/多模态模型预训练算法,利用RAG、Long Context、RLHF、COT等技术,提升模型的理解、推理能力;
2、负责设计、开发和优化电商领域的自然语言处理(NLP)算法,提高搜索、推荐系统的性能和效果;
3、使用NLP/LLM/CV/多模态大模型,对搜索推荐全链路进行算法优化,改进商品创意生成、理解用户行为、理解商品内容等,以提升用户体验和系统智能化水平;
4、大模型评估与调优:设计和实施算法评估框架,对模型性能进行监测和评估,并根据结果进行模型调优,确保系统的稳定性和可靠性;
5、跨团队协作:与产品团队、工程团队和数据团队等紧密合作,理解业务需求,制定并实施相应的算法解决方案;
6、持续学习与创新:跟踪最新的NLP/LLM/CV/多模态大模型研究进展,不断学习新技术和算法,将最新的科研成果应用到实际工程中,保持团队的竞争力;
任职要求
1、有良好的数据分析和挖掘能力,熟练使用数据分析工具和编程语言,有良好的团队协作和沟通能力优先;
2、对新技术和算法有强烈的学习欲望,能够快速适应工作中的挑战;
3、熟悉主流大模型的训练和微调流程、Prompt Engineering等,熟悉相关训练和部署工具的使用如Transformers、DeepSpeed、Megatron-LM等;
4、熟悉深度学习框架,如TensorFlow、PyTorch等,熟悉大模型的开发和优化。

大模型算法工程师
岗位职责:
1、构建电商领域的大模型基座模型,持续优化预训练、后训练算法,利用RAG、Long Context、RL、多模态等技术,提升模型的理解、推理能力;
2、针对大模型Reasoning、Perception等多个方向,研究以RL算法为核心的训练范式,持续探索RL算法的scaling和泛化能力;
3、设计和开发、优化由大模型驱动的电商业务Agent,利用RL等技术,提升Agent的规划、推理能力;
4、使用大模型/多模态大模型技术,改进用户行为理解、商品检索、商品排序、商品创意生成、商品内容理解等环节的效率,提升用户体验和系统智能化水平;
5、设计和实施大模型算法评估框架,对模型性能进行监测和评估,并根据结果进行模型调优,确保系统的稳定性和可靠性;
6、与产品团队、工程团队和数据团队等紧密合作,理解业务需求,制定并实施相应的算法解决方案;
7、持续学习与创新。跟踪最新的大模型研究进展,不断学习新技术和算法,将最新的科研成果应用到实际业务中,提升用户体验和用户留存;
任职要求:
1、有良好的数据分析和挖掘能力,熟练使用数据分析工具和编程语言,有良好的团队协作和沟通能力;
2、对新技术和算法有强烈的学习欲望,能够快速适应工作中的挑战;
3、熟悉大模型的训练和微调流程、Prompt Engineering等,熟悉相关训练和部署工具的使用如Transformers、DeepSpeed、Megatron-LM等;
4、熟悉深度学习框架,如TensorFlow、PyTorch等,熟悉大模型的开发和优化;

大模型Infra架构工程师
岗位职责:
1、负责实现和优化大模型分布式训练以及在线推理系统,提升训练效率和推理性能,包括不限于:架构设计、算子开发、数据处理加速、Checkpoint保存与加载、通信优化等;
2、研究和优化大规模异构加速集群调度、存储、通信互联、监控、Profiling等组件,提升整体硬件利用效率;
3、研究并实现各种模型并行策略(DP/TP/PP/EP/CP)、混合精度、Zero、FSDP、MOE、FP8等技术,加速模型训练,优化显存开销;
4、设计和开发高效的离线、在线推理系统,优化TensorRT-LLM、ONNX-Runtime、vLLM等推理框架,加速整体推理性能;
任职要求:
1、本科及以上学历,具有扎实的计算机基础,熟悉操作系统和网络,熟悉C/C++和Python编程语言,对数据结构&算法设计有较深刻的理解;
2、熟悉至少一种主流的深度学习框架,如Tensorflow或Pytorch;熟悉至少一种主流的模型推理框架,如TensorRT-LLM;
3、熟悉CUDA编程,掌握TensorRT、Cutlass、cuDNN等加速库,有内核级优化经验者优先;
4、具备大型分布式系统开发经验,熟悉MPI、NCCL、Megatron-LM、Deepspeed、FSDP等相关技术;
5、责任心强,思路清晰,技术视野开阔,对业界新技术敏感,喜欢钻研,具有良好的学习能力并注重团队合作;
全部评论

相关推荐

大家好,我是王某,某985计算机专业,机器学习方向。看到这你可能会想:985还找不到工作?装什么弱者啊。但真相是——今年AI行业的秋招,卷到你无法想象。那段被暴击的日子9月开学,我信心满满地开始投简历。985学历 + AI方向 + 两段大厂实习,我觉得拿几个offer应该不难。结果,现实狠狠给了我一耳光。投了150份简历,只收到12个面试通知,命中率不到10%。更惨的是,这12个面试里:5个一面就挂了,4个二面被刷,2个三面凉凉,1个拿到了外包offer,月薪12K。看着身边的同学:双非本科的室友拿了字节、阿里、百度三个offer;同实验室的小张签了商汤,30K起;平时打游戏的老王都拿到了华为AI Lab的offer。我开始怀疑人生:985的牌子,在AI这个赛道上,已经不值钱了吗?那次致命的面试最让我破防的,是腾讯AI Lab的三面。技术面我答得很好,算法题全做出来了,项目经历也讲得很清楚。三面是部门老大,聊了40分钟,氛围特别好。最后他问我:“你有什么问题想问我吗?”我脑子里准备的是:“部门的技术栈是什么?”“团队规模多大?”但临时改口问:“请问贵部门的发展方向是什么?”面试官愣了一下,简单说了几句就结束了。一周后,我收到了感谢信。后来在脉脉上看到,拿到offer的候选人在三面时问了“团队在大模型时代最大的挑战是什么”,聊了半小时,当场给了口头offer。我懂了——我输在了最后5分钟的反问环节。第一,简历要针对性优化。 AI行业的JD,不同公司侧重点完全不同:字节看重工程能力,阿里看重业务理解,商汤看重算法创新。一份简历投所有公司?在AI赛道等于自杀。第二,面试反问环节是决胜点。 有候选人技术面表现一般,但最后问了面试官对大模型落地挑战的看法,聊了20分钟后拿到了机会。『泡泡小程序AiCV简历王』的工具。抱着怀疑的态度试了一下说实话,我一开始是不信的。985的我,还需要工具?我缺的是工具吗?但那天晚上失眠到凌晨3点,我想:反正死马当活马医吧。我上传简历,粘贴了字节AI Lab的JD。10秒后,AI给出了优化报告:· 关键词匹配度:62分(不及格!)· 缺失关键词:分布式训练、模型压缩、ONNX、TensorRT· 内容问题:项目经历缺少数据支撑AI自动优化的效果让我震惊:原版: “负责推荐算法优化,提升了模型效果”优化后: “主导推荐系统召回层优化,基于双塔模型(BERT + Faiss)重构召回策略,使召回准确率从68%提升至82%(+14pp),推理延迟从120ms降至35ms(降幅71%),支撑日均5000万次推荐请求,CTR提升23%”AI不仅加上了数据,还补全了技术细节,而且这些技术栈全都是字节JD里要求的!更惊喜的还在后面7天后的奇迹用AI优化后的简历,我重新投了30家公司。这次没有海投,而是:每个公司单独定制简历针对不同方向调整项目重点确保关键词匹配度80%以上7天后,收到14个面试通知,命中率47%!面试过程更是神奇:字节三面,我问了“大模型时代的挑战”,跟面试官聊了25分钟,从技术聊到产品再到商业化。面试官说:“你的思考很有深度,我们部门就需要这样的人。”当场给了口头offer。腾讯AI Lab,我问了“团队在多模态大模型方向的布局”,面试官眼睛一亮,探讨了20分钟,还问我愿不愿意做这个方向。一周后,offer到手。最终在腾讯AI Lab(SSP,32K * 16)和字节AI Lab之间选择了腾讯。写在最后回头看这3个月,我最大的感悟是:在AI这个极度内卷的赛道,“优秀”已经不够了,你需要“精准展示你的优秀”。简历不是流水账,是你的“商业计划书”。面试不是考试,是“价值交换”。985的学历是门票,但真正让你拿到offer的,是你展示价值的能力。如果你也在找AI方向的工作,投了很多简历却石沉大海,面试反问环节不知道说什么——人总要撞几次南墙,才知道找梯子。现在秋招还没结束,    冲!
你怎么看待AI面试
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务