淘天业务技术-交易营销27届实习内推 Agent开发

职位描述
洞察业务问题,以AI为核心计算引擎,清晰定义目标,设计AI原生架构(AI-Native Architecture),完成任务的编排与交付,将AI的不确定性转化为工程的确定性,让大模型在真实生产环境中稳定落地。具体职责包括:
1.需求共创与问题定义:深入业务一线,通过数据挖掘与特征分析完成现象归因与建模,成为需求的共创者。定义目标与非目标(Goal & Non Goal),将业务需求转译为工程需求。
2.架构与系统设计:针对业务问题进行数学与逻辑建模,从零设计AI原生架构(AI-Native Architecture),包括Agent系统的业务流程建模与闭环设计(意图明确、任务拆解、工具调用、自主执行、反思纠错)。在成本、性能、安全、合规、SLO之间做系统级权衡,设计高可用架构并落实监控告警与自动恢复机制。
3.任务编排与交付:将AI的“不确定性”转化为工程的“确定性”。包括环境构建(API网关、消息队列、缓存等),工程迭代(调试、旁路测试、自动化评测),任务拆解与依赖编排,边界治理(权限分级、审计链、失败兜底),以及交付指标的持续优化。
4.Agent核心能力设计与实现:负责Agent关键模块的方案选型与工程落地,包括:上下文与记忆管理(短期/长期记忆方案,上下文窗口管理,多轮交互的信息连贯性),规划与推理策略(根据业务场景选择和优化ReAct、Plan-and-Execute、反思机制等模式),工具集成与编排(对接业务系统API和外部工具,设计工具描述、调用链路与异常处理机制),RAG/知识增强(构建业务知识库的检索增强方案,优化召回质量与上下文注入策略)。
5.工程正确性管理:明确业务规则与边界条件,定义数据契约。建立分层验证体系与CI阻断机制,持续跟踪缺陷密度与线上故障率,通过灰度发布与渐进式rollout持续降低MTTR。
6.沉淀与迭代:通过复盘提炼业务路径与技术经验,将成功经验内化为可复用的模型能力与系统底座,实现智能的规模化应用。
职位要求
1.基础条件:计算机、软件工程、人工智能等相关专业优先。
2.专业能力
● AI编程工具重度玩家:Cursor、Claude Code等AI编程工具重度或顶级玩家,具备极强的Prompt编写与调优能力,有过完整的项目级开发经验,理解如何让AI写出生产级代码。
● 大模型理解与掌握: 理解主流LLM的能力与局限,能够清晰拆解任务并通过LLM或确定性逻辑兜底实现;熟悉主流大模型的应用范式(Prompt Engineering、RAG、Agent、工具/函数调用、检索增强等)及主流Agent框架(如LangChain等),具备大模型幻觉、Prompt注入等风险的工程化应对思路。
● 委托编排与人机协作: 具备任务拆解、分层与分布设计能力,能完成上下文供给与约束注入,处理多agent协作与冲突治理。
● 验证与交付工程: 掌握测试工程全链路(覆盖、回归、分层),具备根因分析与调试定位能力,熟悉CI、lint、静态分析等变更管理工具。
● 工程与系统素养:能至少在一种主流编程语言(如 Java / Python / JS 等)上有深度的实践经验,掌握常见工程实践并具备优秀的Coding 能力,能够根据场景灵活选型并快速上手。
3.能力特质
● 学习力:对AI有热情、对前沿技术与产品好奇,对未知开放,能举一反三。
● 动手能力:积极主动体验市场中先进的模型和产品,独立阅读论文/技术报告等并快速复现,快速主动尝试落地先进开源项目。
● 技术审美:对新技术有近乎本能的渴望,追求简洁、可维护、可扩展方案;在模型/框架/工具选型上保持高信噪比决策。

【加分项】
1.有AI应用或Agent实际落地经验:包括不限于RAG系统、多智能体编排、结合MCP、Skill等的Agent项目,有可展示的项目/实习成果者优先。
2.开源贡献或技术影响力:在Github上有高质量AI项目、技术博客或社区影响力。
3.对AI Infra有基本理解:了解vLLM、Ollama等推理框架原理,理解延迟优化、KV cache优化、流式输出等工程全景视角。
4.在 CV(计算机视觉)或 NLP(自然语言处理)方向有扎实的理论基础,有实际业务场景模型训练(SFT、RL)等经验的优先 #实习#  #内推#
全部评论
捞捞
点赞 回复 分享
发布于 03-25 11:56 浙江
再捞一下
点赞 回复 分享
发布于 03-21 20:59 浙江
捞一下
点赞 回复 分享
发布于 03-19 20:43 浙江

相关推荐

03-24 13:35
门头沟学院 Java
攒攒人品!有面试过同岗的朋友欢迎评论区交流1.实习拷打2.项目拷打3.你们的 Agent 是单 Agent 还是多 Agent?为什么这么设计?有没有考虑过另一种方案?4.Agent 任务是怎么拆分的?拆分粒度是怎么决定的?5.上下文是怎么构建的?你们怎么避免上下文过长或者信息污染?6.如果上下文窗口不够,你优先保留哪些信息?为什么?7.你们做代码理解的时候,AST、调用关系这些信息是怎么用起来的?8.单测生成里,哪些代码其实不适合生成单测?你们是怎么识别并过滤的?9.覆盖率高但测试质量很差,这种情况你见过吗?你们是怎么解决的?10.mock在单测里什么时候是必须的?什么时候反而会带来问题?11.如果一个函数依赖数据库和RPC,你怎么让模型生成的单测还能稳定运行?12.你们怎么评估生成单测的质量?除了覆盖率,还有哪些指标?13.LLM的输入到底是什么?模型真正看到的是什么?14.self attention的核心作用是什么,为什么要拆成 QKV?为什么attention 可以建模长距离关系,15.为什么需要multi-head为什么 attention可以看成动态加权16.同一个 token的 Q、K、V 为什么不一样?17.attention复杂度很高,如果上下文特别长,你会怎么优化?18.模型产生幻觉的时候,一般是什么原因?工程上有什么办法降低19.Python有多线程吗?GIL 是干什么的?什么时候多线程是有用的?20.讲一下C++从源码到可执行文件的流程。21.手撕:给定数组的区间中位数之和:给定一个长度为n的数nums,一个区间 [l, r] 的 中位数 为:如果区间长度是奇数:排序后中间的数,如果是偶数:排序后靠左的那个数,要求:计算所有子数组的中位数之和
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务