岗位关键词

毕业要求:2026届

投递时间:2025年8月6日-2025年12月31日

岗位职责
1.聚焦语音/音乐生成大模型技术研究,涵盖多模态融合,提升长序列建模能力与实时性; 2.研发风格与情感可控技术,构建语义-时序-声学等多级可控接口,支持音色迁移与交互式编辑; 3.落地助手、无障碍等小米应用场景,每年发表顶会论文1-2篇或申请专利2-3项。
岗位要求
1.精通传统端到端和最新大语言模型TTS框架、熟悉声学模型与声码器,具备语音生成或语音克隆项目经验 2.对各个模块的原理、问题、改进点能有自己的深入理解; 3.具备较强的工程实现能力,有开源项目开发经验优先,沟通能力强; 4.在顶级学术会议或期刊发表过相关方向论文者优先; 5.硕士及以上学历,计算机、人工智能等相关专业。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
小米集团
硬件
已上市
北京 上海 深圳 南京 武汉
查看其他 127 个职位