五险一金5% 双休周末双倍工资_牛客网

2024-11-05 14:06

不愿透露姓名的神秘牛友

发布于北京

五险一金5% 双休周末双倍工资

全部评论

推荐最新楼层

我要扒了wwg的皮

门头沟学院硬件开发

吃住都不包吗难道？

点赞回复分享

发布于 2024-11-08 17:55 湖南

第一拖拉机制造厂拖拉机学院硬件开发

佬，周末加班双倍工资吗？

点赞回复分享

发布于 2024-11-06 17:03 甘肃

门头沟学院嵌入式软件开发

请问base是哪呢？

点赞回复分享

发布于 2024-11-06 11:14 广东

07-17 12:42

上海对外经贸大学推荐算法

大模型应用面试内容每家都不一样，不知道怎么准备了。。

第一家：教育行业。后端研发(AI 多模态)问实习比较多。llm的微调部署这些没问，主要是项目实现。Transformer八股。但是后面说进公司要学Java第二家：游戏数据公司。AI应用开发。也是问实习内容，同样没问llm的微调部署，主要是项目实现。后来问面试反馈，说我做的太底层，他们想招聘偏应用的。第三家：车企。大模型算法。偏应用但是主要问八股。lora、MoE这种内容很多，根本记不下来。而且这几次面试我投的都是同一份简历，但是面试问的问题差的很多。最近几个月准备时间也不短，但是越准备要学的东西越多了。。。

点赞评论收藏

分享

07-16 12:38

中山大学算法工程师

大模型面试题：可以用 GRPO来训练非 reasoning任务不

GRPO（Group Relative Policy Optimization）虽然最初是为强化学习中的reasoning任务（如需要多步决策、逻辑推理的任务）设计的，但其核心思想——通过组内策略的相对比较来优化策略——也可以应用于非reasoning任务（如简单的控制任务、分类任务甚至生成任务）。以下是具体的分析和建议：首先我们看下GRPO的关键创新点是：✅组内相对比较（Group Relative）：将策略分成若干组（group），在组内比较不同策略的表现，而非绝对优化单个策略。✅相对策略梯度：通过组内策略的相对优势（relative advantage）计算梯度，降低方差并提升稳定性。这种思想本质上是一种基于比较的优化方法，与任务是否需要“reasoning”无直接关系，因此可以迁移到非reasoning任务中。🤔那么有哪些非Reasoning任务的适用场景呢？（1）简单控制任务（如机器人控制）问题：传统PPO可能因稀疏奖励或高方差导致训练不稳定。GRPO改进：将不同控制策略分组（例如不同参数化的控制器），在组内比较它们的表现，选择相对更优的策略更新。示例：机械臂抓取任务中，组内可以包含不同的抓取轨迹策略，通过相对优势选择更稳定的策略。（2）生成任务（如文本/图像生成）问题：生成模型的策略优化通常依赖对抗训练（GAN）或最大似然，容易陷入模式崩溃。GRPO改进：将生成器分成多个组（例如不同初始化或架构的子生成器），通过组内生成样本的质量相对比较优化策略。示例：在文本生成中，组内比较不同生成策略的流畅性、多样性等指标。（3）分类/回归任务问题：传统监督学习直接优化损失函数，可能对噪声敏感。GRPO改进：将模型的不同参数化版本（如不同dropout、超参数）分组，通过组内相对性能（如验证集准确率）更新模型。示例：图像分类中，组内比较不同数据增强策略的效果。✴️总结GRPO可以用于非reasoning任务，但需重新设计组的划分方式和相对比较的指标。其核心优势在于通过组内相对优化降低方差，适合奖励稀疏或需要多策略并行的场景。如果任务本身已有高效优化方法（如标准的监督学习），GRPO可能不会带来显著提升。🍊如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

点赞评论收藏

分享

07-16 16:47

已编辑

门头沟学院算法工程师

📍面试公司：元戎（凉经）复盘❓面试问题：一面：1、手撕m*n的矩阵从左上到右下（只许右、下），路径数量。dfs/dp✔重排链表 ✔2、拷打项目multi-agent的协作mcp工具怎么搭建agent响应速度多少怎么agent优化响应速度介绍langchainmcp工具的响应怎么优化的二面：1、拷打项目多智能体框架选型原因多agent协作流程负责上下文的agent崩了咋整，怎么维护可靠性响应速度多少，怎么优化agent并发流量、跟踪调用链路这个项目花了多久讲讲大模型部署流程怎么接触的milvus卡尔曼滤波应用场景与原理怎么接触的TensorTR/ONNX，讲讲你的使用流程2、手撕场景：多线程（...

查看15道真题和解析

点赞评论收藏

分享

07-15 09:07

广东外语外贸大学投资银行业务

30岁以后求稳进国企，对吗

30岁以后怕被优化，压力大。可以考虑国企哦，稳定。某运营商国企招算法模型、大数据工程师，AI产品经理有岗位，可以私信我base广州

点赞评论收藏

分享

07-16 10:23

长安大学产品经理

字节跳动大模型｜面试实录｜待入职

一面1、自我介绍2、如何评估 AI聊天产品的好坏?3、你会用哪些指标去衡量AI对话体验?4、目前市面上的AI聊天产品，你觉得谁做得最好?5、为何现在的大模型大部分是Decoder only结构？6、介绍一下如何做竞品调研的，有哪些竞品？7、介绍一下你做过的这两个AI项目在时间规划上分别是怎样的？8、如何搭建AI 评测体系?9、离职原因二面1、自我介绍2、评测集的选择和构造，评测指标的计算评测数据如果和预期不符，你会怎么优化?3、涌现能力是啥原因？4、如何让大模型处理更长的文本？5、llama 输入句子长度理论上可以无限长吗？6、怎么确定选用什么模型以及为什么选择这个模型？7、针对智能客服项目，...

查看26道真题和解析

点赞评论收藏

分享

评论

2

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 秋招签约后的心态变化 #

81699次浏览 805人参与

# 26届的你们有几段实习？ #

41024次浏览 463人参与

# 月薪多少能在一线城市生存 #

24035次浏览 282人参与

# 你觉得早上几点上班合适？ #

71656次浏览 299人参与

# 你以为的实习VS真实的实习 #

26290次浏览 243人参与

# 双非能在秋招上岸吗？ #

221192次浏览 1170人参与

# 你后悔自己读研吗？ #

18523次浏览 234人参与

# 打工人的工作餐日常 #

52189次浏览 408人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

117439次浏览 811人参与

# 一人推荐一个值得去的通信/硬件公司 #

186095次浏览 1858人参与

# 哪些公司真双非友好？ #

15313次浏览 81人参与

# 你认为哪些项目算烂大街？ #

16756次浏览 266人参与

# 追觅科技求职进展汇总 #

17952次浏览 120人参与

# 机械校招之路总结 #

93699次浏览 1894人参与

# 学历贬值真的很严重吗？ #

23683次浏览 168人参与

# 你被哪些公司秒挂过？ #

30527次浏览 239人参与

# 如何KTV领导 #

62522次浏览 472人参与

# 秋招拿一个offer可以躺平吗 #

146195次浏览 940人参与

# 找工作时的取与舍 #

82820次浏览 591人参与

# 最难的技术面是哪家公司？ #

9272次浏览 73人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务