岗位职责
一、团队简介
内容理解基础算法:电商的业务比较复杂,包括商品/视频/达人等多个维度的信息,对NLP/CV/多模态等方向的基础算法技术有依赖。所以我们成立内容理解基础算法团队,主要 focus 在 NLP/CV/多模态的大模型算法和基础算法研发上,旨在沉淀CV/NLP/多模态方向上的业界SOTA模型,同时也需要在这几个方向持续深耕,针对电商数据优化算法,提升电商业务效果
二、职位描述
1. 多模态大模型算法研发:负责电商场景下,图文,图视频等多模态大模型底座的预训练和对齐,产出统一底座,用于电商治理场景所有多模态需求使用。
2. 梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率
3. 技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文5. 有较强的实践能力,在Kaggle,COCO,ImageNet,ActivityNet等比赛获奖者优先;有顶级学术会议(如CVPR、ICCV、ECCV等)发表论文者优先
岗位要求
1. 扎实的机器技术基础,了解前沿的AI技术,发表过高水平学术会议论文或者有竞赛经验者优先;
2. 熟悉多模态大模型工作优先,包括但不限于internvl, llava-next, deepseekvl等等等
3. 在多媒体和计算机视觉某个领域有较深入的研究,包括但不限于:图像搜索、图像/视频分类和识别、图像分割、目标检测、图文多模态模型、和视频文本多模态模型等;
4. 有CV/多模态大模型相关项目经验优先;研发&优化电商视频&商品多模态大模型,结合LLM和视频/商品表征,支持视频多模态分类,视频QA,跨模态检索,商品分类等任务,显著超越线上模型;
5. 有较强的实践能力,在Kaggle,COCO,ImageNet,ActivityNet等比赛获奖者优先;有顶级学术会议(如CVPR、ICCV、ECCV等)发表论文者优先