前端转agent是如何拿到三个大厂offer的

我本科一直做 Web 相关开发,技术栈主要是 React / Node / TypeScript / Python。
一开始接触大模型,其实和很多人一样:写 prompt、接 API、做点 demo。

但很快我就发现,如果只是“调 API + 写 prompt”,其实很难真正做出复杂的 AI 应用。

这篇文章主要分享一下:从前端工程师转向 Agent 开发,我的一些经验和踩过的坑。

一、很多人刚接触大模型时,会觉得 AI 应用开发就是:

写 Prompt

调 OpenAI API

输出结果

但实际上,如果要做复杂应用,真正的问题通常是:

上下文管理(Context Engineering)

工具调用(Tool Use)

任务轨迹设计(Agent Trajectory)

状态管理(Memory / State)

成本与延迟控制

这些其实更接近 系统工程问题,而不仅仅是 prompt 的问题。

二、前端背景有几个优势
1 状态管理经验
前端:
state → view

agent:
state → reasoning → action

本质类似。

2 工程能力
前端工程师通常很熟悉:
模块化
API 设计
工程结构
渐进式披露(很重要)
这些在 Agent 框架设计里很重要。

3.相关技术栈
openclaw,cluade code和opencode均使用typescript作为其主要开发语言,ts在agent项目里的使用比重很高。

三、Agent 的核心其实是“轨迹”
很多人以为:
prompt → answer

但 code agent 实际是:
thought
→ tool call
→ observation
→ thought
→ tool call
→ ...

所以关键问题变成:
如何设计agent loop
如何设计 tool
如何设计 observation
如何管理上下文

四、最近面试和做项目的过程中,我也有一些反思:

1 多复盘,而不仅仅是做项目

很多时候不是做得不够多,而是复盘不够。

2 定量大于定性

不要只说“优化了性能”,而是尽量给出指标:

- latency ↓
- token cost ↓
- success rate ↑

3 多方案 trade-off

工程问题通常没有唯一答案,关键是:

- 方案 A
- 方案 B
- 为什么选 B

4 技术要服务业务

不仅要看技术指标,还要看:

- 用户体验
- 成本
- 整体业务效果

5 尽量 close ticket,而不是一直做 demo
AI 领域很容易陷入“做很多酷的 demo”
但真正的工程能力是:解决具体问题并落地。

五、如果你也是 Web 开发背景,其实完全不用焦虑“AI 门槛很高”。

很多 AI 应用开发,本质上还是工程问题:

系统设计

状态管理

工程架构

只是多了一个新的组件:LLM。

如果你已经有扎实的工程基础,再补充一些:

LLM 基础

Agent 设计

Context Engineering

其实是可以很自然地转过来的。

全部评论
主包有什么推荐的知识资源吗,我也是前端开发但是想多了解这部分的内容
2 回复 分享
发布于 03-08 12:06 广东
大佬太强了给大佬打Q
点赞 回复 分享
发布于 03-13 20:38 湖北
大佬,你写的很好啊,这篇非常有参考价值诶,我私信你啦~
点赞 回复 分享
发布于 03-12 14:24 北京
大佬太强咯!
点赞 回复 分享
发布于 03-10 16:19 美国
agent开发找实习要学微调或者大模型底层相关的知识吗
点赞 回复 分享
发布于 03-09 15:56 湖北
我是面的后端进去做agent开发,感觉如果能找到好的相关文章的话,一周足以,其实现在代码都是交给Claude code写[笑cry其他再写的过程中就学就行了[羞涩]
点赞 回复 分享
发布于 03-07 21:38 广东

相关推荐

发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流1.实习拷打2.项目拷打3.处理查询文档里的异构数据(如图片)时,具体的处理流程是什么?解析成纯文字后如何进一步加工?这样只返回文字给用户,图片信息不会丢失吗?4.你们是通过人工打标建立图片和文本的对应关系吗?文档量很大的情况下,打标工作能完成吗?5.如何保证大部分图片异构数据解析后回答的正确性?若回答错误,怎么识别问题?后续要验证回答准确性,你有什么方案?6.用于评测的另一个大模型,如何构造问题、分析文字并进行对比?这个大模型的正确率以及模型自我一致性怎么确定?7.你们的模型基于哪些异构图像做增强?模型会不会产生幻觉,生成文档外的内容?8.若用户的问题不在文档里,你们会怎么处理?是调用其他模型吗?大模型回答不了时,会提示用户补充问题吗?用户补充后仍无法解决该怎么办?模型如何判断何时需要让用户补充提问?9.你们有框架编排这些流程吗?用的是什么框架?10.怎么理解检索召回率?这些指标具体包含哪些评价项?什么是忠实度?召回率的分子分母是怎么定义的?11.你之前那段实习的具体工作内容是什么?针对设备故障叙述报告这类复杂文本,模型如何理解?是做了相关检测吗?大模型是怎么实现术语解释的?12.请讲一下LoRA技术,除了减少参数量,它还有什么优点?你做的LoRA相关工作,后续有落地应用吗?13.你写代码主要用Python吗?会不会用Java?了解Java的多线程、双亲委派模型以及消息中间件吗?有没有做过Java相关项目?
点赞 评论 收藏
分享
评论
14
65
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务