滴滴语音方向算法实习生招聘:
工作城市:北京
岗位职责(具体工作内容):
1、参与超大规模语音数据治理:参与数亿级语音数据的自动化清洗、质量评估与元信息挖掘(如语种、信道、噪声等);
2、大规模声纹建模:协助训练与优化千万级ID的声纹识别(Speaker Recognition)模型,提升大规模场景下的识别准确率与鲁棒性;
3、语音预训练探索:参与自监督/半监督语音表征学习(如WavLM、Whisper-style等)的预训练实验与调优;
4、语音大模型垂类适配:基于通用语音大模型(如Whisper、MMS、VALL-E、SpeechGPT等),开展以下属性感知微调与对齐:
声纹特征解耦与表征学习
情感识别
性别与年龄属性预测
方言/口音识别与适配
任职资格:
1、计算机、人工智能、电子信息、声学或相关专业硕士及以上在读(2026年及以后毕业)
2、精通Python,熟悉 PyTorch,具备大规模数据处理经验
3、熟悉语音基础技术:声纹嵌入(x-vector, ECAPA-TDNN)、情感特征(eGeMAPS, IS13)、方言识别或属性分类模型
4、了解自监督预训练语音模型(如 Wav2Vec 2.0、Whisper、MMS)或语音大模型基本架构
5、每周可实习 ≥4天,持续 ≥3个月
加分项:
1、有声纹/情感/方言相关项目或竞赛经验(如VoxCeleb、IEMOCAP、DF2022等)
2、熟悉多任务学习、解耦表征、提示微调(Prompt Tuning)或LoRA等大模型适配技术
3、掌握音视频处理工具链(FFmpeg, librosa, torchaudio, Kaldi)
4、在 INTERSPEECH / ICASSP / ACL / EMNLP 等会议发表过相关工作
简历投递:邮箱 xuetaolve@didiglobal.com
PS:流程贼快,急需人,面试要求不高
工作城市:北京
岗位职责(具体工作内容):
1、参与超大规模语音数据治理:参与数亿级语音数据的自动化清洗、质量评估与元信息挖掘(如语种、信道、噪声等);
2、大规模声纹建模:协助训练与优化千万级ID的声纹识别(Speaker Recognition)模型,提升大规模场景下的识别准确率与鲁棒性;
3、语音预训练探索:参与自监督/半监督语音表征学习(如WavLM、Whisper-style等)的预训练实验与调优;
4、语音大模型垂类适配:基于通用语音大模型(如Whisper、MMS、VALL-E、SpeechGPT等),开展以下属性感知微调与对齐:
声纹特征解耦与表征学习
情感识别
性别与年龄属性预测
方言/口音识别与适配
任职资格:
1、计算机、人工智能、电子信息、声学或相关专业硕士及以上在读(2026年及以后毕业)
2、精通Python,熟悉 PyTorch,具备大规模数据处理经验
3、熟悉语音基础技术:声纹嵌入(x-vector, ECAPA-TDNN)、情感特征(eGeMAPS, IS13)、方言识别或属性分类模型
4、了解自监督预训练语音模型(如 Wav2Vec 2.0、Whisper、MMS)或语音大模型基本架构
5、每周可实习 ≥4天,持续 ≥3个月
加分项:
1、有声纹/情感/方言相关项目或竞赛经验(如VoxCeleb、IEMOCAP、DF2022等)
2、熟悉多任务学习、解耦表征、提示微调(Prompt Tuning)或LoRA等大模型适配技术
3、掌握音视频处理工具链(FFmpeg, librosa, torchaudio, Kaldi)
4、在 INTERSPEECH / ICASSP / ACL / EMNLP 等会议发表过相关工作
简历投递:邮箱 xuetaolve@didiglobal.com
PS:流程贼快,急需人,面试要求不高
全部评论
相关推荐
