04-18 20:15 门头沟学院算法工程师

关注

百度大模型算法二面分享日常实习

给我面没招了，发点面经攒攒人品～
1.实习拷打
2.检索环节做了哪些优化？在检索优化过程中，你是如何进行数据预处理的？有没有使用特定的检索算法？
3.答案生成环节做了哪些优化？你是如何在答案生成环节控制生成质量的？有没有引入外部知识源或增强模型能力？
4.是否做了 SFT 或强化学习相关工作？在哪个环节做的？你在 SFT 或强化学习中，如何设定奖励函数？是否有定期调整策略？
5.SFT 过程中是否对类别标签做了清洗或修正？标签清洗具体是怎么操作的？对性能的提升有多大帮助？
6.强化学习的样本量是多少？在强化学习训练中，样本量的选择是否影响到模型的收敛速度？如果有，如何应对？
7.基础模型经常分类分不准的案例有哪些？你在模型分类不准的情况下，采取了哪些调整？是通过数据增强还是算法改进？
8.在校项目任务的输出可以简单描述并举例吗？任务输出的质量如何评估？有没有一个量化的标准？
9.单智能体能否完成在校项目相关工作？为什么要使用多智能体？多智能体系统与单智能体系统相比，是否有提升项目效率的作用？举个例子说明。

全部评论

推荐最新楼层

昨天 22:06

杭州电子科技大学大数据开发工程师

这个问题我问过几个正在做Agent的朋友，综合他们的回答整理了下。

基础得先打牢。LLM的基本原理要懂，不需要能训练模型，但得知道prompt怎么写、上下文窗口是怎么回事、为什么模型会幻觉。这些是地基，地基不稳上面全是空中楼阁。然后是框架。LangChain和LlamaIndex是目前用得最多的，几乎每个Agent项目都绕不开。但别只会调API，得理解它们的设计思路，比如chain是怎么串联的、memory是怎么管理的、tool calling是怎么实现的。RAG是必学项。Agent大量依赖外部知识库，向量数据库至少要会用一个，embedding是怎么回事要清楚，检索策略怎么优化要有概念。工程能力别忽视。Agent本质上还是个软件系统，API设计、异步处理、错...

想从事Agent应该学习...

点赞评论收藏

分享

04-18 19:57

湖南工程学院自动化

几天跟一个学弟聊，他面后端岗，二面开始就猛问八股：MySQL 索引、Redis 持久化、TCP 三次握手、JVM GC，项目反而只带过两句。感觉不少中大厂、外包和流程化强的团队，对于校招生都这样。建议项目和八股两手抓，别裸奔。

哪些公司面试还在问八股？

点赞评论收藏

分享

04-15 13:13

广西大学算法工程师

高德大模型算法开发一面(暑期)

1. 自我介绍2. 项目拷打3. Perplexity 的定义、公式和真正的使用边界是什么Perplexity 本质上是语言模型对测试序列平均不确定性的指数化表达。若测试集为(x1,…,xT),则 它等价于平均负对数似然的指数形式，值越低通常表示模型对数据分布拟合得越好。很多人只会背“越低越好”，但真正面试里要说明白：PPL 是训练分布拟合指标，不直接等价于问答质量、推理能力、事实性或者指令遵循能力。模型可能 PPL 更低，但在复杂推理或者对齐任务上不一定更强。4. 为什么不同 tokenizer 下的 Perplexity 不能直接横向比较因为 PPL 的分母是 token 数，而 toke...

AI-Agent面试实战...

点赞评论收藏

分享

04-18 23:20

门头沟学院 Java

腾讯AI应用开发实习一面分享攒人品夯版

继续来分享下最近的面经~欢迎友好讨论，信息共享一、 项目：分库分表与数据库查询1. 分库分表基础：你是怎么做分库？怎么分表的？2. 分片键选择：你是对什么取哈希的？（引出 Shop Number 和二级索引）3. 跨库跨表场景：分库分表以后，你要做一些跨库或跨表查的话是怎么查？二、 项目：深分页优化1. 深分页原理：你这里用书签记录法去规避这种深分页，这种是怎么做呀？2. 书签法使用前提：你这个查的是有序查的吗？三、 八股：MySQL1. MySQL 事务隔离级别有哪些？四、 项目：并发控制与中间件1. Lua 脚本动机：在这个红包系统里用了 Redis 的这种 Lua 脚本做增减，为什么用 Lua 脚本不用比如 Redis 自己自带的这些原子指令（比如 `INCR`/`DECR`）？2. Redis 分布式锁原理：在 Redis 里的分布式锁，它是大概是什么样的以及怎么用的？3. 分布式锁异常容灾（宕机场景）：你这个分布式锁，比如我拿到了以后做处理，在做处理的过程中服务挂掉了（意外宕掉），这个时候怎么办？4. MQ 选型与演进：在这个红包系统里面用了RocketMQ，为什么会选择这种消息队列来去做推送？五、 八股：操作系统八股文1. 说一下线程、进程还有协程他们的一些区别概念。2. 多线程之间会共享哪些东西？六、 Agent 项目机制1. 大模型控制逻辑：在这个 AI Agent 里边有 thinking 阶段，你这个 thinking 阶段它怎么决定是调用工具还是直接回复？七、 手撕代码与 SQL 实战1. SQL 编写题：- 背景：有 `order`（订单表）和 `shop`（商家表）两张表。- 要求：查询每个商家的名称、品类，以及“已完成”订单的数量、金额，并按总金额降序排列。- 考点：`LEFT JOIN`（左连接）、`WHERE` 状态过滤、`GROUP BY` 分组聚合（`SUM`, `COUNT`）、`ORDER BY` 排序。2. 算法数据结构题：- 要求：用两个栈实现一个队列，并支持 `push`（入队）、`pop`（出队）、`peek`（查看队头）操作。- 进阶场景：在这个基础上，如果要求支持“删除中间元素”，该怎么做？

点赞评论收藏

分享

03-31 00:18

广西大学算法工程师

小鹏大模型算法一面

1. 介绍一下你做的这个项目2. LoRA 的基本原理是什么LoRA 的核心思路是，微调大模型时没有必要把整个权重矩阵都更新掉，而是只学习一个低秩的增量。原始权重记作 (W)，微调后的权重写成：其中 (A) 和 (B) 的秩都很低，参数量远小于直接更新整个 (W)。训练时冻结原模型参数，只训练这两个小矩阵，这样显存占用、优化器状态和保存体积都会小很多。它适合做领域适配、指令微调这类任务，因为很多任务对模型的改动并不需要覆盖完整参数空间。LoRA 常见会插在 attention 的 q_proj、v_proj 上，有时也会加在 k_proj、o_proj 或 MLP 层。选哪些层，本质上是在表达...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

62370次浏览 536人参与

# 第一份工作应该选择高薪还是大平台 #

220237次浏览 1031人参与

# 校招第一份工作你干了多久？ #

149913次浏览 630人参与

# AI时代还有必要刷leetcode吗？ #

46739次浏览 557人参与

# 想从事Agent应该学习哪些技术？ #

13559次浏览 380人参与

# 大学生该如何认清当下的就业环境？ #

165740次浏览 907人参与

# 考公VS就业，你怎么选？ #

99749次浏览 520人参与

# 26届春招投递记录 #

4767次浏览 49人参与

# 字节7000实习来了，你投了吗？ #

42677次浏览 322人参与

# HR面都在聊什么？ #

21089次浏览 232人参与

# 有哪些公司在面试时考察AICoding？ #

26640次浏览 432人参与

# 小红书求职进展汇总 #

238297次浏览 1397人参与

# 校招生月薪1W算什么水平 #

143980次浏览 495人参与

# 毕业论文进行时 #

36341次浏览 172人参与

# 第一份工作应该选高薪还是热爱？ #

172381次浏览 1075人参与

# 联影求职进展汇总 #

177005次浏览 848人参与

# 美团开奖 #

408783次浏览 1809人参与

# 博世求职进展汇总 #

18951次浏览 64人参与

# 商战，最累的是我们 #

31506次浏览 98人参与

# 从投递到OC，你用了多久 #

35535次浏览 357人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务