岗位关键词

投递时间:2026年3月9日-2026年6月30日

岗位职责
将大模型能力做成可上线、可迭代、可控成本的产品能力。通过打造数据飞轮、模型适配与后训练、评测与实验等关键手段,实现端到端的闭环交付,持续提升产品的效果与稳定性。 具体职责包括以下相关方向的一项或多项: 需求与问题定义 ● 深入业务与产品共创需求,将诉求转化为可执行的AI任务定义,明确目标、边界、优先级与验收口径。 方案与应用架构 ● 在Prompt、RAG、微调、Agent等路线间做技术选型与权衡,设计端到端应用架构(含上下文、工具调用、记忆、权限与安全),并完成RAG、Memory、Tool Use、多Agent等能力的工程化落地与生产级集成。 数据飞轮与治理 ● 搭建高效的数据采集、清洗与标注工程流水线。前瞻性地探索合成数据与模型自标注等自循环策略,同时建立完善的数据版本追踪与质量评估体系,真正打通“模型训练-业务应用-用户反馈-数据迭代”的增强回路。 模型适配与后训练 ● 主导基座大模型向顶尖垂直行业专家的后训练的全链路技术演进,包括高质量的SFT、RL阶段PPO、GRPO等前沿强化学习与偏好优化算法攻坚,全面突破模型在复杂业务场景下的指令遵循精度、极致可控性与长链路逻辑推理天花板,显著提升大模型在复杂业务场景下应用能力。 评测体系与实验 ● 面向业务目标设计评测指标与Rubric,搭建自动化评测框架(含人工评审),建立离线基准与线上实验体系(A/B、Bandit),持续监控指标漂移与策略投机以防止效果退化。 生产交付与运营 ● 负责系统集成与上线发布,对线上质量、稳定性与成本负责,建立监控、告警、兜底与人工接管机制,推动持续迭代。
岗位要求
基础条件 ● 计算机、数学、统计学等相关专业硕士/博士优先,优秀本科生不受限制。 ● 有顶会论文(ACL/EMNLP/ICLR/NeurIPS/ICML等)/高影响项目/开源贡献者加分。 专业能力 ● 模型与后训练:解Transformer/LLM模型架构、演进原理与局限;具备SFT/DPO/RL等后训练与迭代能力(含数据/评估/优化),对后训练算法有实践经验和深刻认知;拥有Agentic RL训练实操经验者优先。 ● Agent 与系统编排:能做任务拆解与多Agent协作;熟悉RAG、Memory、Tool-Use(含MCP/类协议/Skills等)并能工程化落地;独立开发过具备一定影响力AI应用者优先。 ● 数据构建:具备Data-centric AI意识,精通后训练所需高质量数据挖掘与构造,具备合成数据(Synthetic Data)与动作轨迹(Trajectory)构建实践经验者优先。 ● 评测与交付:能搭建评估闭环(autorater/LLM-as-judge、离线评测、A/B);具备测试、调试、review、安全/隐私与质量门禁能力;能基于评测结果精准分析和定位问题,具备复杂多步任务的量化评估能力者优先。 ● 工程与系统素养:能够通过Vibe Coding快速构建项目原型;理解分布式系统/数据库/计算机系统基础;精通至少一门语言,熟练掌握Python与Pytorch;熟悉Git/命令行;了解大模型训练与推理框架(Megatron-LM、vLLM、DeepSpeed/FSDP等),有分布式训练/大规模数据处理经验(Hadoop/MaxCompute等)加分。 能力特质 ● 学习力:对AI有热情、对前沿技术与产品好奇,对未知开放,能举一反三。 ● 动手能力:积极主动体验市场中先进的模型和产品,独立阅读论文/技术报告等并快速复现,快速主动尝试落地先进开源项目,对主流AI开源项目有贡献者优先。 ● 技术审美:对新技术有近乎本能的渴望,能区分“能跑”与“优雅”,追求简洁、可维护、可扩展;在模型/框架/工具选型上保持高信噪比决策。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
淘宝闪购
消费生活
D轮及以上
上海
查看其他 10 个职位