大模型预训练算法研究员

薪资面议
2023-09-15










岗位职责
基于类脑科学以及特征学习的发展,超大模型一方面正在对目前的业务性能带来革命性的升级,另一方面也对深度学习系统带来巨大的挑战。例如说,我们该采用怎样的训练策略以在海量数据上获得更好的精度,如何去解决超大模型中的显存爆炸和算力效率问题?如果你对大模型预训练这一领域有兴趣,欢迎加入我们,共同探索大模型的精度极限,推动超大模型的产业应用。
岗位职责
如下:1、深入研究超大规模神经网络在海量数据上的训练精度问题,实现超大规模神经网络的高精度训练;
2、利用预训练大模型,突破各类视觉任务的精度瓶颈(包括但不限于:检测、分割、生成、多任务学习);
3、负责超大规模神经网络训练技术在公司实际业务场景中的落地使用;
4、负责研发通用模型,探索使用高精度Teacher进行知识蒸馏。
任职资格
1、有比较扎实的计算机理论基础,熟练使用Python/C++编程;
2、有计算机视觉 / 深度学习基础,熟悉计算机视觉中的常见问题与算法,了解模型训练的原理,熟悉任一深度学习框架;
3、一定的算法实现能力,有深度学习编码与调试经验。