昨天 03:30 门头沟学院机器学习

关注

百度文心一言大模型算法实习一面

给我面没招了，感觉自己好菜，发点面经攒攒人品
1、 PPO 与 GRPO 的区别，分别介绍他们的优势与缺点
2、 DPO 对齐训练的曲线是怎么样的，正例的概率会提升嘛
3、 Deepseek -R1里面不仅推理能力很好，而且文采能力也很好，这个是个开放问题，如何让模型的文采能力也很好呢
4、 DPO 如何解决回答过长的问题，除了正则
5、开放问题：为什么现在大家都在关注于大模型的推理能力 reasoning
6、对于一个 base model 如何增强大模型的 reasoning 能力
7、模型选型时是否做定性定量对比ab test，客观数据验证文心性能不好了吗
8、 DPO 除了长度问题还有其他的问题嘛，与问题2对应， reward hacking ？都没有奖励模型了

全部评论

推荐最新楼层

02-10 11:42

已编辑

门头沟学院推荐算法

聊聊Agent实习

总结一下最近面试的 agent 实习面试，包括深信服，anker，minimax，万物云，吉比特整体感觉是：不再考 “你会不会用大模型”，而是考 “你能不能把 Agent 系统跑在真实工程里”。下面把我遇到的高频 Agent 面试题，按模块系统性总结一下，供后来者参考。一、Agent 在学术 / 工程上是如何拆分的？高频问题：Agent 在学术上由哪些部分组成？和普通 LLM 应用有什么区别？二、上下文工程 vs Prompt 工程（几乎必考）高频问题：上下文工程和提示词工程有什么区别？三、如何减少幻觉（Hallucination）高频问题：Agent 如何减少幻觉？在工业场景下怎么做？四、多 Agent / 多异步任务下，如何防止上下文污染？五、RAG 流程（几乎场场都有）六、MCP vs Tool / Function Calling七、工程基础Redis 为什么单线程？HTTPS 握手流程？经典算法（课程表 / 拓扑排序）SFT/PPO/DPO/GRPO 的区别，微调一个大模型的流程是什么样的？

等闲_：我的也可以和楼主的结合一下

查看10道真题和解析

点赞评论收藏

分享

02-11 14:23

吉林大学测试工程师

TestNG入门(二)：数据驱动与分组测试策略

TestNG入门(二)：数据驱动与分组测试策略 1. 数据驱动测试概述 数据驱动测试（Data-Driven Testing）是自动化测试的核心理念之一。它的核心思想是将测试数据与测试逻辑分离，使得同一套测试代码可以验证多组不同的测试数据。 1.1 为什么需要数据驱动？  提高测试覆盖率：一个测试方法可以验证多组数据 减少代码重复：避免为相似场景编写多个测试方法 便于维护：测试数据变更时无需修改测试代码 支持外部数据源：可以从数据库、Excel、CSV等外部文件读取数据  2. 项目实战：用户登录系统测试 在这个项目中，我们将模拟一个用户登录系统，学习如何通过数据驱动的方式测试不同的登录场景。...

简历中的项目经历要怎么写

点赞评论收藏

分享

昨天 02:11

蚌埠坦克学院 Java

好像进入了人生的分水岭，但我看不清

奈何身边无人可说，干脆发网上给大家看个热闹。今天公司年会，老板又让我毕业干脆留在公司，这事目前已经说了很多次了。其实我在入职前其实就已经简单表明过自己的意向了，我想尝试去大公司。他看起来以为我说的是各种工业界的大厂，其实我更喜欢互联网。说说我的看法吧。由于我只把这里当暂时的过度地，整个年会都是以局外人视角在旁观。这里是二线城市的一家小型电气公司，老板是业界有名的专家，公司最大的技术头子。据我观察年会总结发言时的场景，能看出来公司员工对于这位老板很是信服，成员关系还算融洽。喝酒时和聚餐完后，老板总在跟我画饼，说自己多牛逼，公司的前景，要带我做一番事业如何如何，然而就是没讲能给什么待遇。老实说感情牌没啥感觉，我生活水深火热只能放眼当前，只看见一个前景不明的企业，不感兴趣的业务。或许我之后会后悔。我现在仍然在挣扎于简历修改，算法练习和八股/技术学习的深渊中，之后的前景是一片迷茫的。或许我之后会处处碰壁，后悔自己为何没有选择留下获得一份相对稳定的制造业工作。又或许我能突出重围，有机会去做自己真正喜欢的工作，挣更多的钱。可惜我无法看清自己的未来，或许我该留下？我不知道。我只决定遵循自己内心的想法，明年可能会是决定命运的一年。（番外：今天1点多才下班，我跟老板照顾一个同事老哥，他为了表现自己直接喝的不省人事了，我俩抬不动只好叫120，折腾的够呛。他真的太想进步了）

我的实习日记

点赞评论收藏

分享

02-12 15:35

门头沟学院机器学习

淘天AI Agent一面面经-日常实习

面了一个小时 整体来说不难1、快速排序原理 时间复杂度 极端情况裂变2、极端情况怎么解决 用别的排序方法？3、场景题设计一个排序的方案4、hashmap冲突怎么解决 优缺点5、场景题6、多轮对话相关存储 记忆 解决方案 这个问了好多7、rag怎么设计的

查看6道真题和解析

点赞评论收藏

分享

不愿透露姓名的神秘牛友

02-04 17:26

求国企offer选择

投票

工商银行市分科技菁英（研发经）总包15W 硕士海归

点赞评论收藏

分享

评论

点赞

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 春招什么时候投？ #

9568次浏览 161人参与

# 今年秋招你收到了多少封邮件？ #

37336次浏览 273人参与

# 春节前，你还在投简历吗？ #

12996次浏览 151人参与

# 牛友的春节生活 #

6562次浏览 139人参与

# 牛客AI体验站 #

14612次浏览 266人参与

# 春节提前走，你用什么理由请假？ #

9301次浏览 219人参与

# 从夯到拉，锐评职场mentor #

4444次浏览 64人参与

# 备战春招/暑实，现在应该做什么？ #

4337次浏览 144人参与

# 实习到现在，你最困惑的一个问题 #

4131次浏览 118人参与

# 距离春招还有一个月，你现在是什么开局？ #

6250次浏览 109人参与

# AI“智障”时刻 #

25890次浏览 129人参与

# 聊聊Agent开发 #

23443次浏览 576人参与

# 机械人的offer怎么选 #

250332次浏览 1186人参与

# 暑期实习什么时候投？ #

6592次浏览 154人参与

# 推荐一个值得做的AI项目 #

6394次浏览 168人参与

# 投格力的你，拿到offer了吗？ #

171493次浏览 875人参与

# 非技术2024笔面经 #

465997次浏览 4940人参与

# 实习生应该准时下班吗 #

335724次浏览 1737人参与

# 通信硬件薪资爆料 #

1226548次浏览 7207人参与

# 大家实习每天都在干啥 #

121689次浏览 633人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务