我对 AI 工程师的要求 | 2026

为了帮团队里的小伙伴更好地发展成为AI工程师,整理了一份我认为必备的技能清单,分享给大家~
RAG系统搭建
✅ LlamaIndex 框架熟练使用
✅ 向量化模型选型(去HuggingFace MTEB榜单找)
✅ 文档切片策略设计
✅ 向量索引原理掌握(如HNSW算法
✅ 向量数据库实战(Milvus/Weaviate二选一)

多Agent编排能力
✅ LangGraph工作流设计
✅ SSE协议实现实时交互

大模型原理(必须懂!)
✅ Transformer架构深度理解
✅ 跟着 CS336 系统学习
✅ 手撸过 Karpathy的mini-GPT
✅ LoRA/QLoRA原理能讲清楚
✅ SFT、GRPO训练方法
✅ 量化技术原理

 模型微调实战
✅ PEFT库熟练使用
✅ llamafactory一键微调
✅ WandB实验追踪

 模型部署优化
✅ vLLM高性能推理

 效果评估体系
✅ 传统指标(BLEU/ROUGE)
✅ LLM-as-judge设计
✅ 人工评估流程搭建

 LLMOps工程化
✅ 模型版本管理
✅ A/B测试框架搭建
✅ 效果实时监控系统

我的建议:
不要贪多!基础不牢地动山摇~
 加分项:
• 有过从0到1搭建AI系统的经验
• 踩过坑并有解决方案沉淀
• 能用简单语言讲清楚复杂原理
你们觉得还有什么必备技能?评论区见! #掌握什么AI技能,会为你的求职大大加分#
全部评论
学完这些博士都毕业了
3 回复 分享
发布于 02-24 16:40 江苏
收藏
点赞 回复 分享
发布于 02-24 16:42 湖北
学完这些硕士都毕业了
点赞 回复 分享
发布于 02-24 16:40 甘肃

相关推荐

03-21 04:30
门头沟学院 Java
发点面经攒攒人品~1.实习介绍2.拷打第一个项目3.拷打第二个项目4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?6.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?8.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?9.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?10.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?11.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?15.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?16.针对大规模PDF解析这种任务,你选择多线程还是多进程?17.如何确保Agent返回的结果是标准的JSON格式?如果模型输出中有多余的说明文字,你在后端如何提取?18.场景题:对于RAG,如果检索到了针对同一故障的两份手册,内容相互冲突,请你设计一套逻辑,让模型能够识别冲突并优先选择时效性更高的信息?19.手撕:第k大元素
查看19道真题和解析
点赞 评论 收藏
分享
评论
1
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务