TGT专项- 具身智能视觉基座大模型
薪资面议
算法工程师 北京 不限

投递时间:2025年5月21日-2025年10月31日
岗位职责
1、利用京东物流积累的真实场景中人、包裹和场地产生的海量动作事件视频数据,基于ViLLA的思路训练物流场景的垂域模型;
2、训练能够理解物流场景中的物理规律、空间规律以及大量业务常识的视觉大模型,并最终实现向具身智能视角的迁移;
3、针对sim-to-real的迁移问题,利用类似NVIDIACosmos的方案,通过生成式大模型生成长尾数据,以弥补仿真环境与真实环境之间的差距;
4、在具身智能的真实环境中,利用视频理解大模型判断机器人动作的正确性,并给予奖励得分,自动收集真实场景中的正负样本,最终反哺视觉基础模型;
5、最终将训练好的视觉基座模型接入到机器人或机械手臂,以实现京东物流具体场景的落地应用;
岗位要求
1、获得本科及以上学历,计算机、人工智能、自动化、数学、物理等相关专业;
2、熟悉Python编程,掌握PyTorch/TensorFlow基础操作,了解Transformer架构原理;熟悉大模型的并行处理和分布式训练技术;
3、有CV项目经验(如课程设计、竞赛)、熟悉Linux开发环境或分布式训练工具者优先;
4、有多模态大模型预训练或者微调经验者优先。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报