#

AI

#
397181次浏览 3144人互动
此刻你想和大家分享什么
热门 最新
点赞 评论 收藏
分享
11-25 20:19
已编辑
桂林理工大学 Java
offer
投票
一、中山纬创 C#后端 在厂区 6k 包住四人间上床下桌,食堂有补贴  双休,节假日不调休放假 试用期三个月80%有加班现象,说是一个月到手6k(含加班费),扣五险一金后。二、东金创投 Python后端 深圳 7.5K(大概率) 试用期2个月薪资6500元,  转正后视表现定档D10(A-8000  B-7500  C-7000  D-6500)。转正后会根据考核情况:增加全勤奖、转正两个月后增加餐补。上班时间五天制,9:00-11:30   13:30-18:00。但公司不加班。证券公司,有各种福利之类的,活动很多!三、数字马力 今天刚二面完 java+AI跑池子中 不低于9k 挂!!!四、蚂蚁金服--软通动力外包 Agent方向 不低于9k 组内氛围好,leader会帮助规划学习路线,重要的不是完成需求,而是思考进步。开价10k,不交全额社保可以再拿1320,但加班严重,压力大,还有就是外包懂得都懂三四都在长沙,离家近,偶尔加班,技术可能更强。打算去东金了,因为不加班真的很吸引人,其次就是三四了,毕竟在长沙离我家近,就是不知道这两家二面结果如何。数字码力挂,外包过东金要求这周四到岗,也就是11.27号,很急。中山纬创是26到岗,同样很急---就是这个投票,怎么持续一周啊,我已经火烧眉毛了,毕竟我现在在电子厂担任工艺工程师(计时!!!,一小时11)月休四天,每天12小时,6k左右,到手5k+。基本计时薪资2k,加班薪资2k,绩效考核2k。我来这儿电子厂的话,是我家里面让来的,说熬三五年就可以出头,甚至可以开厂,有可能?而且工位短缺,我没工位,一直在车间,生产组小团体严重,会孤立排挤人,而且与工程部有矛盾,导致我们没工位只能待在车间的新来的工程师,被孤立!!!
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
09-04 15:45
点赞 评论 收藏
分享
腾讯内推!大模型各个岗位应有尽有!算法,推理,产品,开发!
投递腾讯等公司9个岗位
点赞 评论 收藏
分享
面试官:Deepseek推理大模型与指令大模型(如豆包、文心)等有什么不同?
一、训练范式与核心技术1. 强化学习主导- DeepSeek-R1基于大规模强化学习(RL)完成后训练,其强化学习训练占比超过95%,甚至存在完全依赖RL的DeepSeek-R1-Zero版本。- 传统指令模型(如文心、ChatGPT O1)则更依赖监督微调(SFT)和人类反馈的强化学习(RLHF)。2. 冷启动与多阶段训练- DeepSeek-R1通过引入高质量“冷启动”数据辅助初始阶段学习,并结合多阶段训练策略(如拒绝采样)提升推理能力。- 而指令模型通常直接从预训练模型通过SFT对齐人类偏好。二、能力与任务适配性1. 复杂推理能力- DeepSeek-R1专门针对数学推导、代码生成、逻辑分析等复杂任务优化,其推理过程中支持自我验证、错误检测及多路径探索。- 指令模型更侧重通用对话和指令理解,在复杂推理任务中表现较弱。2. 生成质量差异- DeepSeek-R1的纯RL版本(R1-Zero)存在生成内容可读性较低的问题,需通过混合训练策略改进,- 而指令模型因依赖SFT数据,输出更符合人类语言习惯。三、架构设计与成本效率1. 优化算法创新- DeepSeek-R1采用Group Relative Policy Optimization(GRPO)等新型RL算法,支持无监督条件下的推理能力进化。- 指令模型通常沿用PPO等传统RLHF算法。2. 成本优势- DeepSeek-R1在同等性能下成本比OpenAI o1系列低30倍,且在数学、代码基准测试中达到甚至超越Claude 3.5 Sonnet等模型。四、应用场景与合规性1. 垂直领域适配- DeepSeek-R1更适用于科研、金融等高精度推理场景,- 而ChatGPT O1等指令模型偏向通用客服、教育等泛化场景。
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客网在线编程
牛客网题解
牛客企业服务