首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
想开了的祖国花朵很喜欢疯狂星期四
江西理工大学 Java
发布于江西
关注
已关注
取消关注
@小北的求职树洞:
面试官:Deepseek推理大模型与指令大模型(如豆包、文心)等有什么不同?
一、训练范式与核心技术1. 强化学习主导- DeepSeek-R1基于大规模强化学习(RL)完成后训练,其强化学习训练占比超过95%,甚至存在完全依赖RL的DeepSeek-R1-Zero版本。- 传统指令模型(如文心、ChatGPT O1)则更依赖监督微调(SFT)和人类反馈的强化学习(RLHF)。2. 冷启动与多阶段训练- DeepSeek-R1通过引入高质量“冷启动”数据辅助初始阶段学习,并结合多阶段训练策略(如拒绝采样)提升推理能力。- 而指令模型通常直接从预训练模型通过SFT对齐人类偏好。二、能力与任务适配性1. 复杂推理能力- DeepSeek-R1专门针对数学推导、代码生成、逻辑分析等复杂任务优化,其推理过程中支持自我验证、错误检测及多路径探索。- 指令模型更侧重通用对话和指令理解,在复杂推理任务中表现较弱。2. 生成质量差异- DeepSeek-R1的纯RL版本(R1-Zero)存在生成内容可读性较低的问题,需通过混合训练策略改进,- 而指令模型因依赖SFT数据,输出更符合人类语言习惯。三、架构设计与成本效率1. 优化算法创新- DeepSeek-R1采用Group Relative Policy Optimization(GRPO)等新型RL算法,支持无监督条件下的推理能力进化。- 指令模型通常沿用PPO等传统RLHF算法。2. 成本优势- DeepSeek-R1在同等性能下成本比OpenAI o1系列低30倍,且在数学、代码基准测试中达到甚至超越Claude 3.5 Sonnet等模型。四、应用场景与合规性1. 垂直领域适配- DeepSeek-R1更适用于科研、金融等高精度推理场景,- 而ChatGPT O1等指令模型偏向通用客服、教育等泛化场景。 #产品经理# #Ai产品经理# #AI# #牛客创作赏金赛# #牛客激励计划#
点赞 11
评论 2
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
05-02 19:11
已编辑
河海大学 Java
PDD 暑期实习 二面面经
轻微压力面,回答没有反馈直接过,八股吟诵全部打断1.自我介绍2.实习期间负责的工作3.redis缓存穿透缓存null值-->采用变化key值攻击就没有效果4.布隆过滤器误判原理?如何减少误判率?5.CAS的思想?6.java的volatile?能保证线程安全吗?7.代码八股题,考察线程池的线程饥饿问题,解决方案?回答不同任务提交不同线程池,再问其他方案,g提示异步回调,后面查是CompletableFuture有线程池异步提交任务的api能让出线程8.手撕lc-hot100 合并区间
投递拼多多集团-PDD等公司10个岗位 >
点赞
评论
收藏
分享
04-28 16:45
南京大学 Java
荣耀-4.28通用软件开发工程师实习生二面(综合面试)面经
📍面试公司:荣耀👜面试岗位:通用软件开发工程师实习生📖面试流程:没问八股,没问项目细节,主要是对个人情况的了解。 自我介绍。 针对参与过的一个多人协同的项目,介绍项目中承担的角色。讲了我参与的实验室科研项目,因为我那两个Java开发的项目都是网上找的(一个黑马点评、一个RPC)🤐 你提到的项目分为三个部分,那三个部分都是什么呢? 这个项目你投入了多长的时间? 在项目中有没有出现和同学间技术分析时产生分歧的情况? 最后这个项目集成是由谁负责的呢? 这个项目的协同是怎么开展的? 在你学生生涯中,你觉得最有挑战的一段经历是什么?你觉得这件事情对你的最大挑战在哪里? 请概括一下自己个人的性格特...
查看12道真题和解析
软件开发2024笔面经
软件开发笔面经
点赞
评论
收藏
分享
04-04 02:03
西安理工大学 Java
汇丰银行(软开)
自我介绍(要求英文)业务介绍(这家公司挺看重业务理解的)加问:如果你毫无经验的接受一个任务,并且周围同事都毫无经验,怎么办?(后面主管进行补充:任务切分)hr面:闲聊
汇丰银行HR面1人在聊
查看3道真题和解析
点赞
评论
收藏
分享
03-13 16:51
已编辑
门头沟学院 硬件开发
春招的硬件大厂感觉都卡学历,基本都没回信
恳求各位🐂友对我的简历批评指正
NiuNiu_Zi:
你是我见过最美的牛客女孩
点赞
评论
收藏
分享
04-29 20:13
已编辑
华南理工大学 C++
4.29字节广告业务一面
前几天在boss上投的字节广告业务部门,hr在一天后通知我面试,但是4.29当天下午面试前,再到boss上查找这个岗位显示"岗位已停止招聘",估计是已经找到人了,当kpi面吧,同时最后面试官建议我c++没有实习可以去投各个岗位(如游戏,等),更加确定挂了,答得也不是非常好以下是面筋(记忆写):1.自我介绍2.项目粗略拷打20min,介绍nginx反向代理,正向代理相关内容,分片上传和断点续传如何实现,死锁如何检测,内存泄漏如何检测,拥塞控制如何实现,socket网络编程,sql联表查询,如何实现登录功能,单点登陆了解吗?3.问到了很多redis和mysql,但是mysql我表示自己不太熟,虽然...
查看19道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
左手敲代码的程序员,不配拥有offer吗?
5.8W
2
...
和ai聊天,忍不住爆哭
1.0W
3
...
给你看看给大学生开10k的前端面经长啥样
7543
4
...
一写代码就哭,因为毕设想退学了
6402
5
...
快手投诉后续- HR把我拉黑了!
5048
6
...
感觉我妈被时代红利保护的太好了
4513
7
...
毕业之后,大家就会回到自己的阶级
4476
8
...
投1000份简历0面试!!!(求助)
4440
9
...
5.1假期你投不投简历
4147
10
...
携程春招火车票oc
2602
创作者周榜
更多
正在热议
更多
#
找工作,行业重要还是岗位重要?
#
11604次浏览
210人参与
#
国企还是互联网,你怎么选?
#
123724次浏览
960人参与
#
盲审过后你想做什么?
#
13495次浏览
119人参与
#
五一之后,实习真的很难找吗?
#
49548次浏览
352人参与
#
外包能不能当跳板?
#
22730次浏览
192人参与
#
设计人如何选offer
#
99033次浏览
694人参与
#
潍柴工作体验
#
17283次浏览
17人参与
#
摸鱼被leader发现了怎么办
#
41358次浏览
316人参与
#
Offer比较,求稳定还是求发展
#
39378次浏览
226人参与
#
运营面经
#
98721次浏览
1200人参与
#
领导秒批的请假话术
#
10800次浏览
83人参与
#
面试中,你被问过哪些奇葩问题?
#
63726次浏览
778人参与
#
五一假期,你打算“躺”还是“卷”?
#
40746次浏览
499人参与
#
一句话证明你在找工作
#
294852次浏览
2437人参与
#
每人推荐一个小而美的高薪公司
#
72970次浏览
1358人参与
#
小厂实习有必要去吗
#
42616次浏览
260人参与
#
哪些公司校招卡第一学历
#
54301次浏览
207人参与
#
如果不工作真的会快乐吗
#
102310次浏览
876人参与
#
蚂蚁集团工作体验
#
10920次浏览
70人参与
#
你觉得通信/硬件有必要实习吗?
#
92815次浏览
891人参与
牛客网
牛客企业服务