徐先生
阿里巴巴集团·应用开发
刚刚
上次在线
100%
反馈率
4天
处理时长
在招职位 (2)
算法工程师
400-800元/天
杭州
本科
岗位职责
这是一个综合的AI推理、优化的技术岗位,适合希望从事以下工作的候选人投递:
● 希望从事AI应用构建与模型优化工作的候选人
● 希望从事AI应用数据构建与自动化评测工作的候选人
● 希望从事多模态AI应用构建与算法优化工作的候选人
围绕真实业务核心场景,参与AI应用的系统化构建与优化,把AI变为业务增长引擎,具体职责包括以下相关方向的一项或多项:
1、AI应用全生命周期演进:深度参与业务问题建模、应用架构设计、上下文工程、训练数据构建、自动化评估体系、模型后训练优化等;
2、数据飞轮构建:打造高质量数据生产链路,探索合成数据(Synthetic Data)与高效蒸馏技术方案,跑通“业务-模型-反馈”迭代闭环;
3、评测体系构建:面向业务目标,设计完备的AI应用效果评估体系,构建自动化评估框架,建立离线评估与在线业务指标联动的量化评估能力;
4、强化学习与奖励机制设计:构建可工程化的Reward体系与RL训练环境,提升模型在垂直业务场景中的可控性与泛化能力;
5、AI外部能力体系搭建:实现AI应用所需的知识库(RAG)、长短期记忆系统(Memory)、工具调用、多Agent协作框架等
6、多模态AI应用开发:构建AI应用的多模态感知与推理能力,解决在UI自动化、视觉理解与审核、多模态会话等场景的落地应用问题。
岗位要求
1、专业要求:计算机、数学、统计学等相关专业硕士/博士优先,优秀本科生不受限制;
2、模型理解与优化:深入理解Transformer和主流LLM模型架构演进原理,对后训练算法有实操经验和深刻认知,拥有Agentic RL训练实操经验者优先;
3、AI应用构建能力:掌握主流AI协议(MCP、Skills等)、记忆系统(Memory)、知识库(RAG),独立开发过具备一定影响力AI应用者优先;
4、代码与工程能力:较强Python编程能力,熟练掌握Pytorch,了解大模型训练与推理框架(Megatron-LM、vLLM、DeepSpeed等),能高效处理分布式环境下的工程问题;
5、数据构建能力:有很强的Data-centric AI的意识,精通后训练所需高质量数据挖掘与构造,具备合成数据(Synthetic Data)与动作轨迹(Trajectory)构建实操经验者优先;
6、评测能力:拒绝盲目调参,能针对Agent任务设计科学的评测体系(LLM-as-a-Judge),能基于评测结果精准分析和定位问题,具备复杂多步任务的量化评估能力者优先。
7、对新技术有近乎本能的渴望,能够独立阅读论文/技术报告等并快速复现,快速主动尝试落地先进开源项目,对主流AI开源项目有贡献者优先。
加分项:
1、在AI顶会(ACL/EMNLP/ICLR/NeurIPS/ICML等)发表大模型评测、数据合成、Agent、RL相关一作或共一论文;
2、知名大模型评测框架或高质量开源数据核心贡献者;
3、极强的数学功底和逻辑分析能力,对高质量数据和评测有端到端闭环经验。
申请
后端工程师
400-800元/天
杭州
岗位职责
1.需求理解与归因:
● 深入业务场景,利用数据挖掘与特征分析完成现象归因;精准识别高价值问题,将模糊的业务痛点转化为明确的 AI 解决目标。
2.架构设计:
● 面向具体业务需求,设计 AI 原生系统架构;参与 Agent 系统核心模块的规划,包括记忆管理、推理策略与工具编排,兼顾架构的灵活性、可扩展性与工程可落地性。
3.知识与环境构建:
● 搭建AI与现有业务系统的交互环境,涵盖 API 接入、RAG 知识库构建、记忆方案设计;持续优化召回质量与上下文注入策略,为模型提供准确、及时的执行环境与知识支撑。
4.核心能力实现:
● 负责Agent关键模块的工程落地,实现意图识别、任务拆解与反思纠错闭环;封装标准化SDK/API服务,构建Agent观测体系,实现全链路追踪与多维归因分析。
5.系统迭代与演进:
● 建立搭建自动化评测与回测机制,通过调优与Case分析不断收敛效果与性能提升的最优路径;沉淀方法论与可复用组件,推动 AI 能力从单点验证走向规模化落地。
6.性能优化:
● 优化高并发场景下的系统性能,通过异步处理与降级策略保障稳定性,通过低侵入性观测手段保障系统的长期稳定运行。
岗位要求
1.基础条件
● 计算机、软件工程、人工智能等相关专业优先。
2.专业能力
● AI编程工具重度玩家:Cursor、Claude code等AI编程工具重度或顶级玩家,具备极强的Prompt编写与调优能力,有过完整的项目级开发经验,理解如何让AI写出生产级代码。
● 大模型能力理解与掌握:理解主流LLM的能力与局限,能够清晰拆解任务并通过LLM或确定性逻辑兜底实现;熟悉主流大模型的应用范式(Context Engineering、Prompt Engineering、Agent、工具/函数调用等等)及主流Agent框架(如LangChain等),具备大模型幻觉、Prompt注入等风险的工程化应对思路。
● 扎实的代码和工程能力:具备扎实的计算机基础知识,深入理解数据结构、算法、网络和操作系统等相关知识,能至少在一种主流编程语言(如 Java / Python / JS 等)上有深度的实践经验,掌握常见工程实践并具备优秀的Coding 能力,能够根据场景灵活选型并快速上手。
3.能力特质
● 学习能力: 具备快速啃透前沿论文(Paper)的能力,并能将理论知识转化为工程代码。
● 开放性与动手能力: 拒绝纸上谈兵,有自己独立完成的小项目(开源项目或个人 Demo),展现极客精神。
● 好奇心与想象力: 面对未知事物有独特的想法,具备敏锐的问题定义能力和坚韧的解决问题能力。
● 审美追求: 技术亦有审美,鼓励你提出能提出打动人心、简洁优雅的好想法。
● 高能动性: 具备强烈的自驱力,能够主动探索边界,而不是等待被分配任务。
加分项
● 有AI应用或Agent实际落地经验:包括不限于RAG系统、多智能体编排、结合MCP、Skill等的Agent项目,有可展示的项目/实习成果者优先。
● 开源贡献或技术影响力:在Github上有高质量AI项目、技术博客或社区影响力。
● 对AI Infra有基本理解:了解vLLM、Ollama等推理框架原理,理解延迟优化、KV cache优化、流式输出等工程全局视角。
● 在 CV(计算机视觉)或 NLP(自然语言处理)方向有扎实的理论基础,有实际业务场景模型训练(SFT、RL)等经验的优先。
申请
阿里巴巴集团 电商 不需要融资 杭州市
阿里巴巴集团创立于 1999 年,业务覆盖电商、云计算、本地生活、物流、医疗、文娱、国际商业等全领域,全球员工规模庞大,是全球领先的互联网与科技企业。集团构建完善的技术体系与人才培养机制,推行轮岗、导师制与全球化项目机会,薪酬福利与职业发展体系行业领先。业务场景丰富,创新空间充足,应届生可从事技术研发、产品、运营、市场、战略等全品类岗位,在全球顶尖商业科技平台实现长期发展。