打破AI求职信息差——AI应用架构师

一天一个AI岗位介绍,今天要解读的JD岗位是——AI应用架构师。简单来说就是将大模型、AI 能力真正 “装进” App 里,用户能直接使用AI。从手机里的 AI 助手、智能翻译,到可穿戴设备的健康监测等等,都离不开AI应用架构师的工作

1.主要工作内容

这个岗位的日常工作其实可以拆成四大块

首先是大模型应用的全流程落地:从数据准备、模型训练、评测,到推理部署,再到工程链路搭建,全程参与大模型在移动端的落地。

然后是LLM的算法研究与落地,你要研究并落地各种 LLM 相关的前沿技术,比如:

  • 多模态大模型:让 AI 不仅能听懂话,还能看懂图、理解视频;
  • RAG 检索增强:让 AI 能调用外部知识,回答更准确、更靠谱;
  • Agent 智能体:让 AI 能自主完成复杂任务,比如帮你规划旅行、处理工作;
  • 还有 SFT/RLHF 微调、Prompt 工程等,让大模型更贴合业务场景。

第三部分是业务赋能,即你要持续探索在各种用户场景下,如何用 AI 能力增强业务的迭代效果。比如:

  • 让AI助手更懂用户的需求,主动提供服务;
  • 用 AI 优化 App 的推荐算法,让用户刷到的内容更合心意;
  • 在健康监测类 App 里,用 AI 分析数据,提前预警健康风险等等。

最后,闷头做技术也不行,还需要跨团队协作把技术变成产品的 “桥梁”:你会深度参与产品研发项目,和产品经理、业务研发、质量测试等同学密切配合。你的角色就是把 AI 技术翻译成产品功能,让团队里的每个人都能理解 AI 能带来什么,最终一起把项目收益做到最大化。

2.能力要求(简历上可以重点突出一下)

那么想要加入这个赛道的你,需要具备什么能力呢

首先在技术硬实力方面:

(1)LLM 算法基础

你需要扎实掌握大语言模型相关算法,包括但不限于:

  • 单模态 / 多模态 LLM 训练(如文本、图像、语音多模态融合);
  • RAG 检索增强生成、SFT 监督微调、RLHF 人类反馈强化学习;
  • Prompt 工程、模型蒸馏与部署优化。

(2)主流模型与框架

你需要熟悉 BERT、Transformer、ViT、CLIP 等主流预训练模型,理解它们的原理和适用场景。熟练掌握至少一个主流机器学习框架,如 TensorFlow、PyTorch 或 Keras

而在软实力方面你需要:

(1)业务建模能力

你需要能把复杂的业务问题,拆解成可以用 AI 解决的算法模型。比如:如何用 AI 提升用户留存率?如何用 AI 优化客服效率?这考验的是你对业务的理解和抽象能力。

(3)跨团队协作能力

你不是一个人在战斗,需要和产品、研发、测试等同学紧密配合。清晰的沟通能力、同理心和团队协作精神,能让你更好地推动项目落地,把技术价值转化为产品价值

3.投递建议

这个岗位适合这些同学投递:

计算机 / 软件工程 / 人工智能等相关专业的毕业生:

如果你在学校做过 NLP、CV、大模型相关的课程设计、毕设,或者参加过 Kaggle、天池等 AI 竞赛,都可以大胆投递。

有移动端开发经验,想转型 AI 的社招同学:

如果你做过 iOS/Android 开发、Flutter 或 React Native,对端侧性能优化、用户体验有理解,再补一些 AI 知识,会非常有优势 —— 你懂 “设备”,AI 应用架构师刚好需要把 AI 装进设备里。

如果你想加入这个岗位,这里有一些帮助你提升竞争力的建议:

(1)做 1-2 个端侧 AI 落地项目

比如:做一个手机端的 AI 聊天助手(用开源 LLM + 移动端推理框架),或做一个智能相册,用多模态模型自动分类、打标签。这些项目能直接展现你的垂直能力,不要偷懒跳过这一步哦。

(2)参与开源 LLM 项目

去 GitHub 上找热门的移动端 LLM 项目(如 Llama.cpp、Qwen.cpp 等),提交 PR、写文档、做 Demo,这会是简历上非常亮眼的一笔。

(3)学习端侧 AI 推理框架

比如 ONNX Runtime、TensorFlow Lite、PyTorch Mobile,了解如何在手机上跑模型、做性能优化,这是 AI 应用架构师的核心技能之一。

最重要的还是自驱力与学习欲:AI 领域技术迭代极快,需要保持强烈的好奇心和自驱力,主动关注行业动态,学习最新的论文、开源项目和最佳实践,才能不被淘汰。

不同的公司对AI应用架构师有不同的侧重要求,建议大家结合自身技术与优势投递~

#AI求职实录#
全部评论
感谢分享,吸欧气!
1 回复 分享
发布于 02-28 20:11 四川
ai开发工程师以后是不是就是玩aim
点赞 回复 分享
发布于 03-11 18:50 北京
这个架构岗是来根据应用选择模型?
点赞 回复 分享
发布于 03-03 19:00 陕西

相关推荐

04-10 13:13
门头沟学院 Java
1.自我介绍2.深度参与项目,产出3.OCR为撒做文件识别;部署的哪个4.传统的读取pdf docx api sdk有用过吗5.文本内容为啥还要用ocr6.pdf 图片内容;图片,图表的理解,怎么做;饼状图,折线图怎么提取语义信息7.ocr背后的原理,给一个饼图,然后怎么输出内容8.是否真的了解怎么识别 占比 类比这样的语义识别9.有看过ocr调用,语义保留这样的指标的评估10.怎么做评估;完全识别的指标又是怎么评估;九十分一百分怎么打分完全识别11.图表识别怎么评估打分,怎么评判,有哪些依据12.为啥选768维度13.讲下embedding模型,怎么做embedding14.embedding模型底层;什么是token;为撒100wtoken最大token数15.大语言模型参数了解吗;在显存消耗的哪个层面消耗的16transfomer词表是怎么构建的吗17.ES怎么构建的;这里面的关键词怎么构建的;BM25基于什么原理18.一部分milvus语义召回,一部分ES关键词召回;怎么返回用户的19.精排维度是多少,原理是什么20.rerank精排基于什么;为撒精排效果更好21.你觉得这些策略涉及有哪些问题;讲了四个问题权重;向量维度;双向量检索的策略;切分策略(切分维度)22.针对上述的你提的问题,说出自己解法23.最核心的一个指标的什么;最核心的指标;归纳出最核心的一个综合指标24.function calling mcp skill,解释概念;用到什么场景;分别解决了什么问题答得不好25.prompt engining ,context  engining,hareness enginering 解释什么问题答得不好26.抽象类和接口却别27.jvm内存回收;什么情况下适合标记清除,什么标记整理28存活时间怎么定义这里列下六个ai概念和解释24. Function Calling、MCP、Skill:概念、场景与解决的问题这三个概念其实代表了 AI 智能体(Agent)与工具交互的三个不同层级:底层协议、通信标准、业务封装。1. Function Calling (函数调用)概念:这是大模型的一种底层能力。它让模型不仅能输出文本,还能输出结构化的数据(如 JSON),告诉程序“我要调用哪个函数,参数是什么”。解决的问题:解决了“模型说不清楚,程序读不懂”的问题。它打破了模型只能聊天的限制,让模型有了“手”,能触发外部动作。场景:简单的工具调用:查天气、计算器、查询数据库。提取结构化信息:把用户的一段话转换成 JSON 对象。2. MCP (Model Context Protocol,模型上下文协议)概念:由 Anthropic 提出的标准化通信协议。你可以把它理解为 AI 界的 USB-C 接口。它定义了一套标准,让 AI 应用(Client)能统一地连接到各种数据源和工具(Server)。解决的问题:解决了“连接碎片化”和“上下文孤岛”的问题。以前每接一个工具都要写一套适配代码,现在只要工具支持 MCP 协议,AI 就能直接连,不用重复造轮子。场景:企业级应用集成:统一连接本地文件、Google Drive、Slack、GitHub 等。跨平台工具共享:开发者开发一个 MCP Server,所有支持 MCP 的 AI 客户端都能用。3. Skill (技能)概念:这是面向业务的能力封装。它通常是一个包含指令、脚本、资源和提示词的“文件夹”或集合。Skill 往往基于 Function Calling 构建,但更复杂。解决的问题:解决了“工具零散,无法完成复杂业务”的问题。它把一个个原子化的函数(如“查航班”、“查酒店”)组合成一个有意义的业务能力(如“订机酒套餐”)。场景:复杂任务处理:比如“帮我策划一次旅行”,Skill 会自动规划步骤,依次调用查天气、订机票、订酒店的函数。垂直领域专家:比如“法律助手 Skill”,里面封装了查法条、写文书的特定流程和提示词。📌 总结对比表表格概念本质定位核心解决问题形象比喻Function Calling底层交互协议模型输出结构化指令神经信号(告诉手要动)MCP通信与调度层统一连接标准,避免重复开发USB 接口(通用插头)Skill业务能力层复杂任务编排与封装操作手册(怎么做菜)🧠 25. Prompt Engineering、Context Engineering、Harness Engineering这三个概念代表了 AI 应用开发从“手工作坊”到“系统工程”的进化过程。1. Prompt Engineering (提示词工程)解释:这是最早期的阶段。核心是“写咒语”。通过精心设计自然语言指令(如“你是一个专家,请一步步思考...”),引导模型输出更好的结果。局限:它是一次性的、静态的。如果任务太复杂,光靠一段话很难控制模型。2. Context Engineering (上下文工程)解释:这是目前的主流趋势。核心是“构建信息流水线”。它不再只关注那一句提示词,而是关注如何把最有效的信息(知识、历史、工具描述)在恰当的时机喂给模型。它包括 RAG(检索增强)、记忆管理、摘要压缩等技术。解决问题:解决了模型“记性差”、“知识过时”和“幻觉”问题。它把模型从一个“聊天机器人”变成了一个“拥有外部知识库的专家”。3. Harness Engineering (编排工程/智能体工程)注:Harness 在这里通常指“智具编排”或“系统 harness”,类似于 LangChain 或 AutoGen 这类框架所做的工作。解释:这是最高阶的阶段。核心是“系统级管控”。它不仅仅是给信息,而是设计一个工作流。比如:先让模型 A 写代码,再让模型 B 审查代码,如果报错再让模型 A 修改。它涉及多智能体协作、循环反馈、工具调用的逻辑编排。解决问题:解决了复杂任务的自动化执行和可靠性问题。📌 一句话总结进化史Prompt Engineering:教模型“怎么说话”。Context Engineering:给模型“参考资料和记忆”。Harness Engineering:给模型“ teammates(队友)和工作流程”。
查看28道真题和解析
点赞 评论 收藏
分享
评论
3
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务