前端转AI,要掌握的能力,个人观点

#从事AI岗需要掌握哪些技术栈?#
一、AI 基础知识(核心入门层级)
1. 大模型基础核心概念

- 核心概念:LLM(大语言模型)、Token、上下文窗口、Embedding、微调(Fine-tuning)、提示工程(Prompt Engineering)

2. 大模型关键能力

- 核心能力:文本生成、代码生成、多模态理解(文生图/文生视频)、知识问答

3. 前端视角核心应用(入门落地)

- 模型调用:API 调用大模型方法

- 流式处理:SSE/WebSocket 流式输出处理技巧,可结合缓冲区+分段解析机制优化体验

- 成本优化:Token 消耗优化方法

二、AI 进阶技术(能力提升层级)

1. Agent 核心技术

- 定义:可自主规划、调用工具、完成复杂任务的 AI 实体(代表:Coze 扣子、TRAE)

- 前端视角:Agent 交互界面设计、多轮对话管理,可借助 A2UI 协议实现 AI 驱动的界面动态渲染

2. RAG(检索增强生成)

- 核心:结合私有知识库,提升大模型回答精准度与可控性,本质是“检索-增强-生成”的闭环流程

- 前端视角:RAG 检索过程可视化展示、检索结果与模型输出的联动呈现

3. 多模态 AI 技术

- 核心定义:文本、图像、音频、视频的融合生成与理解(代表场景:剪映 AI 生成、实时交互)

- 前端视角核心技术:Canvas/WebGL 渲染、WebGPU 加速(提升渲染性能);WebRTC 实时流处理(支撑实时交互);多模态内容预览、编辑功能实现(适配前端交互场景)

三、AI 工具链及应用场景(落地实践层级)

1. AI IDE 开发(TRAE、Cursor 方向)

- 核心定位:端到端生成真实软件的智能协作平台

- 前端职责:AI 功能交互(代码生成/理解/问答)、IDE 内核开发、插件生态搭建

- 核心技术栈:React/TypeScript、WebAssembly、Monaco Editor、WebSocket/SSE

2. Agent 平台开发(Coze、HiAgent 方向)

- 核心定位:新一代 AI Agent 协同办公与应用开发平台

- 前端职责:LLM 驱动的 Agent 框架实现、多 Agent 协同界面、可视化编排工具开发

- 核心技术栈:React/Vue、状态管理、可视化编辑器、实时通信

3. 多模态创作与交互(剪映、抖音方向)

- 核心定位:生成模型优化、多模态内容合成、实时交互体验提升

- 前端职责:AI 生成内容预览、实时滤镜/特效、多模态编辑界面开发

- 核心技术栈:WebGL/WebGPU、WebRTC、Canvas、性能优化(FPS、内存)

4. AI + 全栈开发(小红书、美团方向)

- 核心定位:AI Coding 工具辅助,完成前后端开发、测试、部署全流程

- 前端职责:全栈开发、AI 辅助需求分析与方案设计、提升开发效率

- 核心技术栈:Node.js/Python、前后端协作、CI/CD、AI 工具深度使用

5. 可视化与 AI 交互(同顺方向)

- 核心定位:大模型应用可视化交互、RAG/Agent 工作流演示

- 前端职责:可视化 Prompt 编排、多轮对话可视化、模型输出调试界面开发

- 核心技术栈:ECharts/D3.js、流程图库、实时数据渲染、响应式设计
全部评论

相关推荐

> 无意中接到了后端开发的主动邀约,我最近主要在准备前端开发,而且没有正式的做过后端开发,但还是接收了面试。面试主要考察计算机基础,没问后端八股,所以居然基本上答出来了自我介绍研二在读,主要技术栈是前端开发(熟悉Vue / 入门React),跨平台开发(了解Electron / 入门Flutter),和 Agent 开发(了解),常用语言 TypeScript / Python。之前都在准备前端面试,意外得到了后端面试邀约,因为未来有走全栈 / Agent开发的计划,所以斗胆参加了。问答1. 介绍 TCP 协议的连接和断开过程,为什么断开要进行 4 次挥手2. TCP 协议在完成四次挥手后是直接断开吗,要等待多久才断开3. 介绍计算机网络七层协议,为什么要分层4. 进程间通信有哪些方式5. 介绍死锁代码题1. 有 $n+1$ 个数,它们在范围 $[1, n]$,仅有一个重复的数,在 $O(n)$ 时间复杂度,$O(1)$ 空间复杂度内找出这个数2. 股票买卖时机,给定一支股票(T+1交易规则)的 $n$ 天的价格序列,买卖两次(卖出当天不能再买入),求最大盈利3. 给定序列,求最长上升子序列的长度和对应的子序列反问1. 部门的技术栈答:Golang2. 我之前主要准备的是前端开发,但是在 AI 时代对前端的未来比较悲观,未来准备走全栈开发或 Agent 开发。我比较纠结是接受前端开发的转正实习,还是准备全栈和 Agent 项目,未来找正式工作直接投递。您能从过来人的角度给我一些建议吗?答:(没有正面回答)主要是要确保掌握好相关理论基础,大厂对基础比较看重,工作中可能用到
查看10道真题和解析
点赞 评论 收藏
分享
攒人品!!! 大家都要拿到暑期实习的offer啊!!!项目一:1. 你这里的意图判断是怎么做的?直接交给模型做,还是这个用户的查询query做了一些其他处理。2. 为什么要设计这三层记忆架构,是一个通用的设计还是参考了什么论文。3. Agent 的评估是怎么做的4. 有没有评估过你的记忆架构,在没参考openclaw之前和之后的指标有什么变化,成功率有对比吗?5. 你之前向量检索加redis缓存是怎么做的? redis健和值是什么?6. 新的记忆加到文件里 是直接append吗? 覆盖?还是改写?7. 改的方式 模型改吗?模型调用editor去改文件是吗?8. 你觉得 redis+milvus向量存储 和mysql+文件系统+向量检索,他们的优劣如何?优点缺点分别是什么。9. 其实我比较感兴趣的是他们这两种方式的查询检索召回 效率的对比。10. 对于每一个用户,在系统中怎么保存这些不同用户的文档?11. 其实就是模型通过路径去读这些文件是吧,那如果两个人登了同一个账号,在同一时刻,这个文件会被两个不同的用户使用,在这个情况下,你们的系统如何处理?怎么解决这个问题?项目二:1. 你说你的文档准确率达到90%,具体做的改变是什么。2. 那为什么医院的问答项目里,不采用同样的实现3. 你说pdf表格密集,那假如用户就是问一个表格里,第二行是2025年,第三行是2024年,具体问2025年的值是多少,你的系统能做到吗?4. skill是自己写的吗 ,互相之间可以联动吗?5. 为什么不用skill-creator6. 你的数据集是怎么收集的,然后是怎么评估的呢?打分是谁在打分?人在打分 ,还是模型裁判员去打分?如果有很好用的模型裁判员,为什么不用裁判员模型7. 介绍一下KV cache8. 讲一下transfromer架构。算法题1. 字符串数字相减2. 字符串最长连续序列
查看21道真题和解析
点赞 评论 收藏
分享
bg: 末二本,无实习飞猪的电话面,在这之前有一个京东的一面,大概率是kpi,所以阿里的算是处女面了,本来不敢投的,奈何没了解清楚,以为飞猪是哪个中厂想着试一下结果是阿里,牛牛心里素质本来也不咋好,紧张的没边,最后也是丝滑的被挂掉了无自我介绍在项目里担任的工作怎么进行的权限控制为什么nginx能实现跨域同源策略具体是什么除了nginx还有哪些跨域的方法用户关掉浏览器之后再打开是重新登录还是记录登录态怎么实现的token从创建到使用全流程token是过期时间设置在哪里怎么检查的token是否过期RAG对你项目起到什么作用是否对比过向量和关键词检索有没有了解过claude,agent,mcp这些东西养过龙虾吗就是openclawskills和mcp的区别和联系是否用过aicoding反问个人感言: token过期时间是在payload里,然后他问我该怎么检查是否过期,我说用的JWT库的一个方法,他好像不满意,一直在追问,我没太明白是我理解错了吗向量检索和关键词检索我也确实没有对比过aicoding我没用过(牛牛一直是古法编程,匠心手搓,只用ai进行学习和debug),龙虾也没养过,mcp了解一点但是skill了解的不多,我跟他讲mcp是工具包,skill是合理组合利用这些工具实现能力其他的我觉得答得都还行(其他的好像也没啥东西了),总的来说就是欧德奥特曼(old out man),被ai大人狠狠的踩在脚下蹂躏了boss上内推的,流程推的很快,挂的也很快,面试完五分钟就挂掉了,我在boss上问了一下他说要拥抱ai总的来说面试官大人人还不错,也没有阴阳什么的,也让我看到了自己的很多不足,只不过我可能确实能力不太行吧,对ai了解的太少了准备了一天的八股也没用上,我确实没想到前端面试会有这么多ai内容希望后面的面试能顺利一点吧,我会去多了解ai的
查看16道真题和解析
点赞 评论 收藏
分享
头像
04-22 12:46
已编辑
江西财经大学 Web前端
点赞 评论 收藏
分享
评论
点赞
14
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务