首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
匿名牛油
2024-11-05 14:06
不愿透露姓名的神秘牛友
发布于北京
关注
已关注
取消关注
16×14
1/1
学历
2025 | 其他 | 校招
公司
超聚变
岗位
嵌入式软开
地点
深圳
备注
-
更多
「超聚变」
薪资查询
五险一金5% 双休周末双倍工资
全部评论
推荐
最新
楼层
我要扒了wwg的皮
门头沟学院 硬件开发
吃住都不包吗难道?
点赞
回复
分享
发布于 2024-11-08 17:55
湖南
小龙🐟z
第一拖拉机制造厂拖拉机学院 硬件开发
佬,周末加班双倍工资吗?
点赞
回复
分享
发布于 2024-11-06 17:03
甘肃
zzzbro
门头沟学院 嵌入式软件开发
请问base是哪呢?
点赞
回复
分享
发布于 2024-11-06 11:14
广东
暂无评论,快来抢首评~
相关推荐
07-17 12:42
上海对外经贸大学 推荐算法
大模型应用面试内容每家都不一样,不知道怎么准备了。。
第一家:教育行业。后端研发(AI 多模态)问实习比较多。llm的微调部署这些没问,主要是项目实现。Transformer八股。但是后面说进公司要学Java第二家:游戏数据公司。AI应用开发。也是问实习内容,同样没问llm的微调部署,主要是项目实现。后来问面试反馈,说我做的太底层,他们想招聘偏应用的。第三家:车企。大模型算法。偏应用但是主要问八股。lora、MoE这种内容很多,根本记不下来。而且这几次面试我投的都是同一份简历,但是面试问的问题差的很多。最近几个月准备时间也不短,但是越准备要学的东西越多了。。。
点赞
评论
收藏
分享
07-16 12:38
中山大学 算法工程师
大模型面试题:可以用 GRPO来训练非 reasoning任务不
GRPO(Group Relative Policy Optimization)虽然最初是为强化学习中的reasoning任务(如需要多步决策、逻辑推理的任务)设计的,但其核心思想——通过组内策略的相对比较来优化策略——也可以应用于非reasoning任务(如简单的控制任务、分类任务甚至生成任务)。以下是具体的分析和建议:首先我们看下GRPO的关键创新点是:✅组内相对比较(Group Relative):将策略分成若干组(group),在组内比较不同策略的表现,而非绝对优化单个策略。✅相对策略梯度:通过组内策略的相对优势(relative advantage)计算梯度,降低方差并提升稳定性。这种思想本质上是一种基于比较的优化方法,与任务是否需要“reasoning”无直接关系,因此可以迁移到非reasoning任务中。🤔那么有哪些非Reasoning任务的适用场景呢?(1)简单控制任务(如机器人控制)问题:传统PPO可能因稀疏奖励或高方差导致训练不稳定。GRPO改进:将不同控制策略分组(例如不同参数化的控制器),在组内比较它们的表现,选择相对更优的策略更新。示例:机械臂抓取任务中,组内可以包含不同的抓取轨迹策略,通过相对优势选择更稳定的策略。(2)生成任务(如文本/图像生成)问题:生成模型的策略优化通常依赖对抗训练(GAN)或最大似然,容易陷入模式崩溃。GRPO改进:将生成器分成多个组(例如不同初始化或架构的子生成器),通过组内生成样本的质量相对比较优化策略。示例:在文本生成中,组内比较不同生成策略的流畅性、多样性等指标。(3)分类/回归任务问题:传统监督学习直接优化损失函数,可能对噪声敏感。GRPO改进:将模型的不同参数化版本(如不同dropout、超参数)分组,通过组内相对性能(如验证集准确率)更新模型。示例:图像分类中,组内比较不同数据增强策略的效果。✴️总结GRPO可以用于非reasoning任务,但需重新设计组的划分方式和相对比较的指标。其核心优势在于通过组内相对优化降低方差,适合奖励稀疏或需要多策略并行的场景。如果任务本身已有高效优化方法(如标准的监督学习),GRPO可能不会带来显著提升。🍊如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
点赞
评论
收藏
分享
07-16 16:47
已编辑
门头沟学院 算法工程师
面试记录
📍面试公司:元戎(凉经)复盘❓面试问题:一面:1、手撕m*n的矩阵从左上到右下(只许右、下),路径数量。dfs/dp✔重排链表 ✔2、拷打项目multi-agent的协作mcp工具怎么搭建agent响应速度多少怎么agent优化响应速度介绍langchainmcp工具的响应怎么优化的二面:1、拷打项目多智能体框架选型原因多agent协作流程负责上下文的agent崩了咋整,怎么维护可靠性响应速度多少,怎么优化agent并发流量、跟踪调用链路这个项目花了多久讲讲大模型部署流程怎么接触的milvus卡尔曼滤波应用场景与原理怎么接触的TensorTR/ONNX,讲讲你的使用流程2、手撕场景:多线程(...
查看15道真题和解析
点赞
评论
收藏
分享
07-15 09:07
广东外语外贸大学 投资银行业务
30岁以后求稳进国企,对吗
30岁以后怕被优化,压力大。可以考虑国企哦,稳定。某运营商国企招算法模型、大数据工程师,AI产品经理有岗位,可以私信我base广州
点赞
评论
收藏
分享
07-16 10:23
长安大学 产品经理
字节跳动大模型|面试实录|待入职
一面1、自我介绍2、如何评估 AI聊天产品的好坏?3、你会用哪些指标去衡量AI对话体验?4、目前市面上的AI聊天产品,你觉得谁做得最好?5、为何现在的大模型大部分是Decoder only结构?6、介绍一下如何做竞品调研的,有哪些竞品?7、介绍一下你做过的这两个AI项目在时间规划上分别是怎样的?8、如何搭建AI 评测体系?9、离职原因二面1、自我介绍2、评测集的选择和构造,评测指标的计算评测数据如果和预期不符,你会怎么优化?3、涌现能力是啥原因?4、如何让大模型处理更长的文本?5、llama 输入句子长度理论上可以无限长吗?6、怎么确定选用什么模型以及为什么选择这个模型?7、针对智能客服项目,...
查看26道真题和解析
点赞
评论
收藏
分享
一键发评
五险一金5%太低了
接好运
双休周末双倍真好
这待遇怎么样?
有合同吗?
评论
点赞成功,聊一聊 >
2
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
腾讯提前批后台开发凉经teg
6811
2
...
滴滴提前批一面秒挂面经
6137
3
...
滴滴提前批一面
5502
4
...
我和妈妈讲以后我可能给不了她一个月1500
4738
5
...
实习,别太较真
3799
6
...
上班第一周总结
2454
7
...
给公司上一课
2263
8
...
实在智能JAVA实习一面
2058
9
...
听不懂需求把组长逼急了……😭
1990
10
...
我真是服了,怎么工作了还有人抄作业啊
1855
创作者周榜
更多
正在热议
更多
#
秋招签约后的心态变化
#
81699次浏览
805人参与
#
26届的你们有几段实习?
#
41024次浏览
463人参与
#
月薪多少能在一线城市生存
#
24035次浏览
282人参与
#
你觉得早上几点上班合适?
#
71656次浏览
299人参与
#
你以为的实习VS真实的实习
#
26290次浏览
243人参与
#
双非能在秋招上岸吗?
#
221192次浏览
1170人参与
#
你后悔自己读研吗?
#
18523次浏览
234人参与
#
打工人的工作餐日常
#
52189次浏览
408人参与
#
当下环境,你会继续卷互联网,还是看其他行业机会
#
117439次浏览
811人参与
#
一人推荐一个值得去的通信/硬件公司
#
186095次浏览
1858人参与
#
哪些公司真双非友好?
#
15313次浏览
81人参与
#
你认为哪些项目算烂大街?
#
16756次浏览
266人参与
#
追觅科技求职进展汇总
#
17952次浏览
120人参与
#
机械校招之路总结
#
93699次浏览
1894人参与
#
学历贬值真的很严重吗?
#
23683次浏览
168人参与
#
你被哪些公司秒挂过?
#
30527次浏览
239人参与
#
如何KTV领导
#
62522次浏览
472人参与
#
秋招拿一个offer可以躺平吗
#
146195次浏览
940人参与
#
找工作时的取与舍
#
82820次浏览
591人参与
#
最难的技术面是哪家公司?
#
9272次浏览
73人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务