视觉算法工程师-大模型

薪资面议

算法工程师

本科

2026届

史女士本周在线

小米·校园招聘HR

岗位关键词

毕业要求：2026届

投递时间：2025年8月1日-2025年12月31日

岗位职责

技术方面：将围绕多模态（文本、图像、音频、视频）理解和生成统一的基座大模型的数据、模型结构、统一建模方式、训练与推理优化、深度推理等核心问题展开研究，具体研究内容包括： 1. 多模态（文本、图像、音频、视频）数据的收集、合成及数据策略，提升质量、多样性、可扩展性； 2. 探索多模态理解与生成统一的建模方式； 3. 多模态模型的模型结构的设计与优化，高效的大规模分布式训练和推理系统（云侧和端侧）； 4. 研究多模态模型的深度推理范式。业务方面： 1. 参与相机拍摄图像处理、增强、感知等领域的深度学习或传统算法研发工作； 2. 结合产品需求，参与算法的设计、开发、验证、集成、优化和维护，解决算法产品化过程中的各种技术问题，确保算法达到上线要求； 3. 跟进特定领域的行业进展，并结合产品对算法进行优化，使相关产品效果达到业界领先水平。

岗位要求

1. 硕士及以上学历优先，计算机视觉、图像信号处理、机器学习、光学、计算机科学/工程、电子工程、应用数学等相关专业； 2. 一定的图像视频算法实践经验，对图像/视频相关的深度学习或传统算法有深入的理解；熟悉相机ISP算法或CV算法，在图像超分、HDR、颜色、亮度、去马赛克、去噪、缩放、去模糊、防抖、计算成像/计算摄影、图像对齐/融合、识别、分割、深度估计、运动估计、空间感知等研究方向中的一个或几个有算法经验者优先； 3. 对生成算法有探索研究，了解常见生成模型框架，如GAN、VAE、Diffusion、DiT等；熟悉NLP、CV、多模态、AIGC等相关技术，有相关项目经验者优先； 4. 良好的编码能力，熟练掌握至少一门编程语言(c/c++/python/java/matlab)，能够熟练使用c/c++相关开发工具进行代码调试、优化者更佳； 5. 具有较强的内外部沟通能力和协调能力，视野开阔，思维敏捷，创新能力强； 6. 在领域内知名比赛中取得优异成绩者优先，体现解决复杂问题的创造力与竞争力； 7. 笃信通用人工智能（AGI）的未来愿景，致力于通过开放协作与持续创新推动AGI发展； 8. 认同开放共进的企业文化，具备敏锐的逻辑思维、卓越的沟通协调能力和自我学习能力，主动负责，严谨细致，勇于挑战常规，追求极致。

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

小米集团

硬件

已上市

北京上海深圳南京武汉

查看其他 127 个职位

8 笔试题目 1391 面试经验 257 面试短评