04-11 21:20 门头沟学院算法工程师

关注

阿里淘天大模型算法一面 4.10

时长大概1h15m，压力很大，整个过程会不断的打断和追问
1. 介绍grpo和ppo的区别，会频繁打断，不让讲太多，要求精确讲出核心区别
2. ppo的clip操作的作用
3. 重要性采样的作用，除了和clip操作结合限制更新幅度还有什么作用，这种操作和使用kl散度限制更新的区别是什么
4. 马尔可夫性质是什么
5. 从早期的策略梯度算法到现在grpo，有很多模块或者说设定是保留下来的，有些是丢掉了，讲一下发展脉络，为什么要保留/丢掉那些模块
6. 开共享屏幕聊论文，背景，任务设定，对应的实际业务场景
7. workflow，训练方法，用到的公式细节，且会质疑你的数学公式
8. 力扣173，二叉搜索树迭代器，要求先讲思路，三种解法（暴力-优化-正解）

全部评论

推荐最新楼层

03-29 22:49

杭州电子科技大学大数据开发工程师

沪漂北漂哪个更苦？不是都苦吗？

真实感受是：苦的点不一样。北漂苦在天气和距离。冬天零下十几度等公交，鼻涕都冻出来。回家一趟高铁要6小时，过年抢票能把人逼疯。但北京互联网机会是真的多，大厂扎堆，跳槽不用换城市。沪漂苦在生活成本和排外感。同样的工资在上海租的房比北京小一圈，地铁挤到怀疑人生。而且上海人说方言时你真的插不上话，有种隐形的距离感。但气候确实舒服，不用忍受北方的干燥和雾霾。我个人感觉北漂更苦点。因为北京的苦是物理性的——冷、远、干。上海的苦是心理性的——贵、挤、疏离。前者咬咬牙能扛，后者会慢慢消耗你。但说到底，漂哪儿都苦。关键是这个苦值不值。如果能学到东西、攒到钱、看到未来，那苦也就苦了。怕的是苦了半天还在原地踏步，那...

沪漂/北漂你觉得哪个更苦...

点赞评论收藏

分享

04-12 17:35

门头沟学院 Java

soul后端ai开发日常实习一面分享

发点面经攒攒人品～1.实习拷打2.了解redis嘛项目中用到了哪些数据结构3.bitmap用过吗，哪来做了什么4.影响bitmap大小的决定因素，一般你们项目bitmap的大小是多少5.你刚刚提到了签到，那么签到在bitmap里面怎么体现，每一位代表什么，影响这个位图大小的字段是什么6.mq这块如何提高消费速率，假如分区满了，消费者增多还能提高嘛，消费者和分区的关系是什么，不同消费者可以消费同一分区嘛

查看5道真题和解析

点赞评论收藏

分享

03-30 22:41

Blessed John XXIII National Seminary (Weston) Java

90后大龄程序员失业4个月，终于上岸了

嘿，兄弟们好，昨天下午，我从新公司大楼签完字出来，阳光晃得我有点睁不开眼。我坐在路边花坛上，默默点了一根烟，坐了很久。整整 4 个月，120 天。作为一个 90 后、没赶上名校快车、又刚好撞上 30 多岁尴尬年纪的 Java 佬，这 120 天我经历的不仅仅是积蓄缩水的焦虑，更多的是一种职业信仰的崩塌。今天给大家聊聊这 4 个月我到底是怎么熬过来的，以及现在的外面市场到底变成了什么样。那些失眠的夜：从自信到自我怀疑刚失业那会儿，我心里其实挺稳的。干了 10 年 Java，在行业里扛过大流量，找工作还不是简简单单。但现实很快把我教训了。第一个月，我还在挑拣薪资；第二个月，开始觉得不对劲，投出去的...

大家都开始春招面试了吗

点赞评论收藏

分享

04-08 21:15

门头沟学院 Java

虾皮ai后端开发-暑期实习一面攒人品

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.介绍实习2.怎么对多场景 / 多 context 的 agent 进行拆分的？3.你刚才说到虽然对用户来说是在一个对话窗口内，但在你们看来前后诉求其实是不同业务，所以你们拆了多agent。那如果还是一个 agent、上下文和知识库也保持一个 agent，它是会记不住吗？还是为什么一定要拆？4.你们怎么判断该调哪一个 agent？代码具体是怎么实现的？5.你们这个 LLM 是有多个可以选的吗？还是统一用某家公司的模型，或者自己搭建的？6.同样的问题、同样的用例去测试过不同LLM模型吗？7.你用了 Redis 做缓存，这个具体是用在什么地方？是在知识库 / tool 之类的场景吗？8.假如没有这个热点数据缓存，那这些数据会去哪里取？9.但按我理解，这种链路里哪怕数据库慢一点，比如 100ms 和 10ms 或 1ms 的区别，好像也未必特别大，你怎么看？10.你自己当时有过这种疑问吗？就是这套方案里到底需不需要上缓存？11.假如没有缓存，或者缓存失效时还是要查数据库；而数据库又特别慢的话，你会想到哪些优化措施？如果数据量真的特别大。12.如果做分库分表，通常只能按一个维度分，比如用户 ID。那假如我还要支持一些低频、但会按其他字段组合查询的场景，你会怎么设计？13.我举个例子，比如订单表按订单 ID 分表，但后台页面可能要按创建时间、订单状态、店铺 ID 去查，这种低频但多条件查询的场景，你会怎么做？手撕：三数之和

查看13道真题和解析

点赞评论收藏

分享

04-15 14:48

华中科技大学全栈开发

Agent学习之Harness Engineering

AI世界变幻之快，没几天就有新概念了，最近热讨论的是Harness Engineering（驾驭工程）这个词。OpenAI、Anthropic、Martin Fowler……一线的公司和技术大佬都在讨论它。很多科普文章会告诉你：Harness 就是给 AI 设边界、分步骤、做检查,你平时用 Claude Code 时已经在做了用最简洁的话说：Harness 是包裹在大模型外面的"执行与治理系统"。公式就是 Agent = Model + Harness。那么我们给最近爆火的 Harness Engineering 一个清晰直白的比喻：想象你面前有一匹又快又壮的马。你想让它帮...

想从事Agent应该学习...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

61853次浏览 535人参与

# 机械笔面试考察这些知识点 #

17780次浏览 121人参与

# 商战，最累的是我们 #

31404次浏览 97人参与

# AI时代还有必要刷leetcode吗？ #

45466次浏览 548人参与

# 分享一个让你热爱工作的瞬间 #

69706次浏览 504人参与

# 米哈游笔试 #

671195次浏览 1206人参与

# 毕业租房也有小确幸 #

173418次浏览 4555人参与

# 字节7000实习来了，你投了吗？ #

42185次浏览 317人参与

# 想从事Agent应该学习哪些技术？ #

13171次浏览 379人参与

# 机械制造秋招总结 #

117644次浏览 927人参与

# 大学生该如何认清当下的就业环境？ #

165542次浏览 905人参与

# 国企/银行/研究所公司爆料 #

209014次浏览 917人参与

# 26届春招投递记录 #

4713次浏览 49人参与

# 有哪些公司在面试时考察AICoding？ #

26222次浏览 427人参与

# 实习必须要去大厂吗？ #

202129次浏览 1784人参与

# HR面都在聊什么？ #

20689次浏览 230人参与

# 初创公司值得加入吗？ #

44638次浏览 226人参与

# 春招什么时候投？ #

52374次浏览 709人参与

# 你都在哪些场所面过试？ #

80828次浏览 506人参与

# 你现在一天AI几次？ #

21883次浏览 147人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务