田先生_北京字节跳动科技有限公司

田先生

北京字节跳动科技有限公司·算法工程师

---

上次在线

54%

反馈率

5天

处理时长

在招职位 (1)

多模态大模型算法工程师

30-60K * 15薪

北京

硕士

展开

岗位职责

一、团队简介内容理解基础算法：电商的业务比较复杂，包括商品/视频/达人等多个维度的信息，对NLP/CV/多模态等方向的基础算法技术有依赖。所以我们成立内容理解基础算法团队，主要 focus 在 NLP/CV/多模态的大模型算法和基础算法研发上，旨在沉淀CV/NLP/多模态方向上的业界SOTA模型，同时也需要在这几个方向持续深耕，针对电商数据优化算法，提升电商业务效果二、职位描述 1. 多模态大模型算法研发：负责电商场景下，图文，图视频等多模态大模型底座的预训练和对齐，产出统一底座，用于电商治理场景所有多模态需求使用。 2. 梳理&沉淀算法库，抽象算法接口，最大化提高算法/预训练模型的复用率，同时优化数据采集&模型训练&部署&推理的流程，提升研发效率 3. 技术输出：定期分享SOTA模型，赋能电商甚至公司级别的业务BU，沉淀专利和论文5. 有较强的实践能力，在Kaggle，COCO，ImageNet，ActivityNet等比赛获奖者优先；有顶级学术会议（如CVPR、ICCV、ECCV等）发表论文者优先

岗位要求

1. 扎实的机器技术基础，了解前沿的AI技术，发表过高水平学术会议论文或者有竞赛经验者优先； 2. 熟悉多模态大模型工作优先，包括但不限于internvl， llava-next， deepseekvl等等等 3. 在多媒体和计算机视觉某个领域有较深入的研究，包括但不限于：图像搜索、图像/视频分类和识别、图像分割、目标检测、图文多模态模型、和视频文本多模态模型等； 4. 有CV/多模态大模型相关项目经验优先；研发&优化电商视频&商品多模态大模型，结合LLM和视频/商品表征，支持视频多模态分类，视频QA，跨模态检索，商品分类等任务，显著超越线上模型； 5. 有较强的实践能力，在Kaggle，COCO，ImageNet，ActivityNet等比赛获奖者优先；有顶级学术会议（如CVPR、ICCV、ECCV等）发表论文者优先

字节跳动

互联网

D轮及以上

北京市

字节跳动成立于 2012 年，是全球知名的互联网科技企业，总部位于北京，业务覆盖全球多个国家和地区，旗下拥有抖音、今日头条、西瓜视频、飞书等多款知名产品，形成了多元化的产品矩阵。公司聚焦人工智能技术在信息传播、内容创作、办公协作等领域的应用，坚持技术驱动发展，拥有强大的算法研发与产品运营团队，技术迭代速度快，在推荐算法、智能交互等领域形成了核心技术优势。公司员工规模庞大，建立了完善的人才培养与晋升体系，为员工提供广阔的职业发展平台与丰富的项目实践机会，业务布局涵盖内容、社交、办公、教育等多个互联网细分领域。

https://job.toutiao.com/campus/?spread=K8BSDMT