大模型预训练算法研究员

薪资面议
2023-09-15
 什么是官网闪投?
简历直投官网 无需重复填写简历 投后必反馈 进度实时更新 安全可靠官网可查 海量岗位5w+ 移动端投递方便


岗位职责

基于类脑科学以及特征学习的发展,超大模型一方面正在对目前的业务性能带来革命性的升级,另一方面也对深度学习系统带来巨大的挑战。例如说,我们该采用怎样的训练策略以在海量数据上获得更好的精度,如何去解决超大模型中的显存爆炸和算力效率问题?如果你对大模型预训练这一领域有兴趣,欢迎加入我们,共同探索大模型的精度极限,推动超大模型的产业应用。


岗位职责
如下:

1、深入研究超大规模神经网络在海量数据上的训练精度问题,实现超大规模神经网络的高精度训练;

2、利用预训练大模型,突破各类视觉任务的精度瓶颈(包括但不限于:检测、分割、生成、多任务学习);

3、负责超大规模神经网络训练技术在公司实际业务场景中的落地使用;

4、负责研发通用模型,探索使用高精度Teacher进行知识蒸馏。



任职资格

1、有比较扎实的计算机理论基础,熟练使用Python/C++编程;

2、有计算机视觉 / 深度学习基础,熟悉计算机视觉中的常见问题与算法,了解模型训练的原理,熟悉任一深度学习框架;

3、一定的算法实现能力,有深度学习编码与调试经验。

上海人工智能实验室
未融资
上海
查看其他 277 个职位