小鹏汽车 AI Agent 开发 一面

1、自我介绍

2、项目拷打

3、介绍 DeepSearch 与 Manus,以及他们之间区别

DeepSearch 更偏深度搜索和信息整合,它的重点是围绕一个复杂问题去查找资料、筛选信息、归纳总结,最后给出一个相对完整的答案。它本质上还是在帮助用户更高效地获取信息,只不过不是简单返回搜索结果,而是多了一层推理和整合能力。

Manus 更偏执行型 Agent,它不只是给答案,而是会围绕一个目标去拆任务、调工具、执行流程,最后把事情做完。也就是说,DeepSearch 更像是帮用户“找”和“整理”,Manus 更像是帮用户“做”和“完成”。

如果简单概括,DeepSearch 的核心是搜索增强和答案生成,Manus 的核心是任务规划和执行闭环。前者更强调信息获取能力,后者更强调行动能力。

4、介绍 LLM Decoder-Only 架构

Decoder-Only 架构本质上就是只使用 Transformer 里的 Decoder 结构,通过自回归的方式一个 token 一个 token 地往后生成内容。它的训练目标通常是 next token prediction,也就是根据前面的上下文预测下一个 token。

它的关键点在于 Masked Self-Attention。所谓 masked,就是当前位置只能看到前面的 token,看不到后面的 token,这样模型才能按从左到右的方式学习生成。整体结构上,输入先经过 embedding 和位置编码,然后进入多层 Decoder Block。每一层里主要有自注意力、前馈网络、残差连接和 LayerNorm,最后经过线性层和 softmax 得到下一个 token 的概率分布。

像 GPT、LLaMA 这些大模型基本都属于这种架构,它的优势是结构统一、适合生成任务,而且扩展性比较强。

5、反向传播的原理

反向传播本质上就是用链式法则去计算损失函数对各层参数的梯度。训练时先做前向传播,把输入送进网络得到预测结果,再根据预测结果和真实标签计算损失。之后从损失出发一层一层往前算梯度,得到每一层参数对最终损失的影响。

因为神经网络本质上是很多层函数复合起来的,所以前面层参数对最终结果的影响,需要通过后面每一层的导数传回来。反向传播解决的就是怎么高效地完成这件事。算出梯度之后,优化器就可以根据梯度去更新参数,让模型逐步收敛。

6、梯度下降介绍一下

梯度下降是一种最优化方法,目标是让损失函数不断变小。它的基本思想是,梯度表示函数上升最快的方向,那如果想让损失下降,就沿着梯度的反方向去更新参数。更新公式通常就是参数减去学习率乘以梯度。

训练时每算完一次梯度,就根据这个方向调整参数。学习率控制的是每次更新步子迈多大,太大可能震荡,太小又会收敛很慢。实际中常见的有 Batch Gradient Descent、SGD 和 Mini-Batch Gradient Descent,现在更常用的是基于梯度下降改进出来的优化器,比如 Adam 和 AdamW。

7、梯度消失怎么解决

梯度消失主要出现在深层网络中。因为反向传播时梯度要一层层往前传,如果每层导数都比较小,连乘之后前面的梯度就会越来越接近 0,最后前面那些层几乎学不到东西。

解决思路一般有几个方向。一个是换更合适的激活函数,比如少用 sigmoid、tanh,多用 ReLU、Leaky ReLU、GELU 这类函数。另一个是做合理的参数初始化,让网络在一开始训练时数值更稳定。再一个是使用残差连接,像 R

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏 文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点,内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线,提供高频题解析、标准答题思路与工程落地方法,帮助你高效查漏补缺.

全部评论

相关推荐

03-14 21:33
已编辑
东莞理工学院 Java
📍面试公司:好未来🕐面试时间:03/14💻面试岗位:golang后端开发❓面试问题:1. Go 的基本数据类型有哪些?2. 什么是值类型和引用类型,分别有哪些?3. slice 底层结构和扩容机制是什么?4. map 底层基于什么实现,是有序还是无序?5. 对 Go 的 channel 怎么理解?6. channel 一般用在什么业务场景?7. 无缓冲和有缓冲 channel 的区别是什么?8. 如何深拷贝 slice,避免多个变量互相影响?9. Redis 适用哪些业务场景?10. 为什么 Redis 单线程还能支持高并发?11. epoll 在 Redis 中用在什么场景?12. Redis 的 key 过期策略有哪些?13. Redis 过期删除后内存会立刻释放吗?14. Redis 内存满了有哪些淘汰策略?15. Redis 持久化方案有哪些?16. RDB 和 AOF 区别是什么?17. Redis 高可用方案有了解吗?18. Redis 主从、哨兵、集群的区别?19. ES 主要适用于什么场景?20. 业务数据(如订单)能不能存在 ES?21. 多表数据聚合同步到 ES 怎么实现?22. ES 集群健康状态有哪几种,分别代表什么?23. ES 设置分片和副本,允许节点宕机数量怎么判断?24. Kafka 和 RocketMQ 的区别是什么?25. Kafka 为什么会出现消息丢失?26. 如何避免 Kafka 消息丢失?27. Kafka 的 at least once 机制是什么?28. 业务层如何保证消息不丢失、最终一致?29. MySQL 事务隔离级别有哪些?30. MySQL 默认隔离级别是什么?31. 可重复读的含义是什么?32. 什么场景会使用不同的事务隔离级别?33. InnoDB 可重复读是怎么实现的?34. MySQL 有哪些存储引擎,区别是什么?35. MyISAM 适用什么业务场景?36. 联合索引的最左匹配原则是什么?37. MySQL 默认索引类型是什么,和哈希索引区别?38. 多表关联查询、聚合查询如何设计索引?39. 研发工程师应该如何应对和使用 AI?40. 使用 AI 编程工具有哪些风险?41. 怎么避免 AI 生成代码带来的线上问题?42. 平时用什么开发工具和 AI 模型?43. 使用 AI 辅助开发遇到过哪些问题,怎么解决?44.手撕sql包括建立索引等等🙌面试感想:感动坏了,春招以来最舒服的一场面试,大部分问题都回答出来了,并且面试官在你回答出来了之后,还会给予正反馈说没错,你说的对,然后记不太清楚的问题,他还会给予提示,然后告诉你该怎么去回答,并且给出他的看法,也是一天直接速通了两面下周三约HR面
发面经攒人品
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务