视觉算法工程师-大模型

薪资面议
算法工程师
北京
本科
2026届
岗位关键词

毕业要求:2026届

投递时间:2025年8月1日-2025年12月31日

岗位职责
技术方面: 将围绕多模态(文本、图像、音频、视频)理解和生成统一的基座大模型的数据、模型结构、统一建模方式、训练与推理优化、深度推理等核心问题展开研究,具体研究内容包括: 1. 多模态(文本、图像、音频、视频)数据的收集、合成及数据策略,提升质量、多样性、可扩展性; 2. 探索多模态理解与生成统一的建模方式; 3. 多模态模型的模型结构的设计与优化,高效的大规模分布式训练和推理系统(云侧和端侧); 4. 研究多模态模型的深度推理范式。 业务方面: 1. 参与相机拍摄图像处理、增强、感知等领域的深度学习或传统算法研发工作; 2. 结合产品需求,参与算法的设计、开发、验证、集成、优化和维护,解决算法产品化过程中的各种技术问题,确保算法达到上线要求; 3. 跟进特定领域的行业进展,并结合产品对算法进行优化,使相关产品效果达到业界领先水平。
岗位要求
1. 硕士及以上学历优先,计算机视觉、图像信号处理、机器学习、光学、计算机科学/工程、电子工程、应用数学等相关专业; 2. 一定的图像视频算法实践经验,对图像/视频相关的深度学习或传统算法有深入的理解;熟悉相机ISP算法或CV算法,在图像超分、HDR、颜色、亮度、去马赛克、去噪、缩放、去模糊、防抖、计算成像/计算摄影、图像对齐/融合、识别、分割、深度估计、运动估计、空间感知等研究方向中的一个或几个有算法经验者优先; 3. 对生成算法有探索研究,了解常见生成模型框架,如GAN、VAE、Diffusion、DiT等;熟悉NLP、CV、多模态、AIGC等相关技术,有相关项目经验者优先; 4. 良好的编码能力,熟练掌握至少一门编程语言(c/c++/python/java/matlab),能够熟练使用c/c++相关开发工具进行代码调试、优化者更佳; 5. 具有较强的内外部沟通能力和协调能力,视野开阔,思维敏捷 ,创新能力强; 6. 在领域内知名比赛中取得优异成绩者优先,体现解决复杂问题的创造力与竞争力; 7. 笃信通用人工智能(AGI)的未来愿景,致力于通过开放协作与持续创新推动AGI发展; 8. 认同开放共进的企业文化,具备敏锐的逻辑思维、卓越的沟通协调能力和自我学习能力,主动负责,严谨细致,勇于挑战常规,追求极致。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
小米集团
硬件
已上市
北京 上海 深圳 南京 武汉
查看其他 127 个职位