【大模型北斗实习】大模型研究

简历直达核心基座组!

【岗位职责】
本课题研究方向包括但不限于:
1)构建端到端的网页文本内容提取系统,针对网络数据的复杂性,从系统效率和模型效果角度持续优化内容提取算法,迭代生产标准。
2)设计预训练数据的全局质量优化和治理方案,优化全局采样策略、隐私保护和安全合规,提升基座模型训练效率和最终效果。
3)建设多模态交错数据处理链路,通过数据分析和配比实验等手段优化多模态数据质量和多样性,支撑多模态大模型数据需求。
4)推动数据驱动的模型性能突破。
5)负责千亿级网页的大规模处理和万亿级token数据生产,通过分布式计算、模型量化及显存优化的方式提升数据处理和生产效率。
【任职要求】
1)计算机科学、数据科学、自然语言处理等相关专业,具备大模型相关背景,在相关领域有深入研究经历并有实际论文产出或项目经验。
2)扎实的编程功底,熟练掌握TensorFlow/PyTorch/Megatron等深度学习框架,熟悉Java/C++等编程语言;熟练掌握大数据处理工具,如Spark、Flink、Ray等。
3)熟悉大模型训练流程,熟悉Transformer模型结构,对GPT/LLAMA/MoE等模型架构有深入了解。
加分项:
1)有大模型预训练相关数据构建和处理项目经验者优先。
2)发表过高水平论文优先(如NeurIPS,ICLR,ICML,ACL,EMNLP等)。

北斗转正机会较大
如果有意向,请发送简历到邮箱: *********************
或扫描内推码直接投递
全部评论
您好 请问可以内推吗
点赞 回复 分享
发布于 04-12 17:05 北京

相关推荐

06-07 12:20
新余学院 Java
点赞 评论 收藏
分享
06-13 10:15
门头沟学院 Java
想去夏威夷的大西瓜在...:我也是27届,但是我现在研一下了啥项目都没有呀咋办,哎,简历不知道咋写
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务