团队建设 团队负责阿里巴巴手淘短视频和图文内容业务的算法研发建设,致力于利用人工智能前沿技术在内容的挖掘、理解认知、表示学习、创意生成等研究方向来打造手淘内容商业引擎,深度参与内容从生产到理解到分发的全流程;团队在多模态的内容数字化,用户内容消费认知层面持续深耕,并在工业领域的多媒体相关技术应用上有着深厚的积累。团队成员主要来自国内外TOP院校硕博,和众多知名高校、研究机构保持长期的学术合作,近年在CVPR、ICCV、ACMMM、TIP等学术会议后期刊上发表多篇论文,团队研究方向包括不限于多模态学习、意图理解、多模态检索、大规模预训练、SFT/RL等,欢迎加入!职位描述实习招聘多模态语义理解充满热情的算法同学,共同推动平台内容理解能力从“看得见”到“看得懂”的关键跃迁。一起深度参与手淘内容化产品体系的核心能力建设,通过前沿的NLP、计算机视觉与多模态技术,赋能搜索、推荐等核心业务场景。1. 多模态语义理解技术研发:设计并研发行业领先的多模态算法,涵盖种草意图识别、内容表征学习、预训练与微调、模型蒸馏及推理优化等方向,持续提升系统对图文、短视频等内容的深层语义理解与泛化能力。2. 跨模态对齐与融合创新:探索文本、图像、视频、音频等异构模态间的语义对齐机制与深度融合方法,增强跨模态一致性,提升多源信息协同下的理解准确率。3. 高性能语义检索系统构建:打造高精度、高效率的多模态向量检索系统,支持语义级内容匹配与大规模召回,为搜索与推荐提供坚实的技术底座。4. 业务落地与效果驱动:基于手淘海量的图文、短视频、商品及用户行为数据,开展内容分析与理解技术攻关,将前沿研究成果高效落地于实际产品,持续优化用户体验,助力关键业务实现突破。职位要求1. 计算机、人工智能、模式识别、自然语言处理等相关专业硕士及以上学历;2. 熟悉深度学习基础框架(PyTorch/TensorFlow),具备扎实的编程能力;3. 熟悉自然语言处理(NLP)、计算机视觉(CV)基础任务、多模态任务,如文本分类、序列标注、图像理解、目标检测、QA等;4. 有视频理解、多模态内容分析、知识图谱构建、意图识别、文本生成等项目经验者优先;5. 有语义理解与搜推结合应用结合的项目经验者优先;6. 熟悉多模态大模型(MLLM)的训练、微调、推理优化流程,有实际部署经验者优先;7. 在ACL、CVPR、ICML、NeurIPS、EMNLP、MM等顶会发表过论文者优先;8. 有较强的代码竞赛成绩,获得过ACM或其他商业代码竞赛的任意奖项优先。9. 有较强的学术比赛经验或者在知名数据集的Leaderboard上排名靠前优先。10. 与岗位相关的核心项目实习/工作经历,并取得优异项目成果优先;11. 具备良好的问题抽象与建模能力,能独立完成从问题定义到技术落地的闭环;12. 具有良好的团队合作精神,较强的沟通能力,对工作充满激情,能够主动思考和行动,推进工作顺利实施;简历投递**************+email: **********