内推|百川智能一大模型算法工程师-急招

职位描述:

负责后训练(Post-training)相关研发工作,提升模型在数理推理、Planning、RAG、指令跟随、工具调用等方面的能力;
优化和迭代大模型的对齐训练策略和工具,包括 SFT、RLHF、Self-play RL、Agent 优化、模型融合、模型蒸馏等;
开展人类和机器偏好相关研究,提升奖励信号的质量和多样性,解决 Reward Hacking 和奖励融合问题;
参与数据飞轮、合成管道、训练实验、评测工具的开发与升级,提升团队效率,跟进并适配领域和开源的最新进展;
职位要求

计算机或数理相关专业背景,硕士或博士学历优先;
具备优秀的编程能力,精通 Linux、Python 和 Pytorch;
熟悉 Transformer 架构和大模型基础知识,有后训练及数据处理经验者优先;
具备强大的研究和实践能力,能够制定高效实验方案,快速定位和解决问题;
具有良好的沟通和协作能力,具备挑战精神和结果导向。
加分项:

在顶级会议上发表过论文并具有学术影响力。
拥有知名开源项目经验,在开源社区有影响力。
深度参与过知名大模型项目,并在关键技术上有深入实践经验。
有医学背景/医疗大模型/医疗落地实践等经验
内推码:UHA2UC9
内推地址:https://cq6qe6bvfr6.jobs.feishu.cn/s/iA297sBh
全部评论

相关推荐

bg双非本科,方向是嵌入式。这次秋招一共拿到了 8 个 offer,最高年包 40w,中间也有一段在海康的实习经历,还有几次国家级竞赛。写这篇不是想证明什么,只是想把自己走过的这条路,尽量讲清楚一点,给同样背景的人一个参考。一、我一开始也很迷茫刚决定走嵌入式的时候,其实并没有一个特别清晰的规划。网上的信息很零散,有人说一定要懂底层,有人说项目更重要,也有人建议直接转方向。很多时候都是在怀疑:1.自己这种背景到底有没有机会2.现在学的东西到底有没有用3.是不是已经开始晚了这些问题,我当时一个都没答案。二、现在回头看,我主要做对了这几件事第一,方向尽早确定,但不把自己锁死。我比较早就确定了嵌入式这个大方向,但具体做哪一块,是在项目、竞赛和实习中慢慢调整的,而不是一开始就给自己下结论。第二,用项目和竞赛去“证明能力”,而不是堆技术名词。我不会刻意追求学得多全面,而是确保自己参与的每个项目,都能讲清楚:我负责了什么、遇到了什么问题、最后是怎么解决的。第三,尽早接触真实的工程环境。在海康实习的那段时间,对我触动挺大的。我开始意识到,企业更看重的是代码结构、逻辑清晰度,以及你能不能把事情说清楚,而不只是会不会某个知识点。第四,把秋招当成一个需要长期迭代的过程。简历不是一次写完的,面试表现也不是一次就到位的。我会在每次面试后复盘哪些问题没答好,再针对性补。三、我踩过的一些坑现在看也挺典型的:1.一开始在底层细节上纠结太久,投入产出比不高2.做过项目,但前期不会总结,导致面试表达吃亏3.早期有点害怕面试,准备不充分就去投这些弯路走过之后,才慢慢找到节奏。四、给和我背景相似的人一点建议如果你也是双非,准备走嵌入式,我觉得有几件事挺重要的:1.不用等“准备得差不多了”再投2.项目一定要能讲清楚,而不是做完就算3.不要只盯着技术,多关注表达和逻辑很多时候,差的不是能力,而是呈现方式。五、写在最后这篇总结不是标准答案,只是我个人的一次复盘。后面我会陆续把自己在嵌入式学习、竞赛、实习和秋招中的一些真实经验拆开来讲,希望能对后来的人有点帮助。如果你正好也在这条路上,希望你能少走一点弯路。
x_y_z1:蹲个后续
点赞 评论 收藏
分享
01-14 12:34
门头沟学院 C++
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务