- 岗位职责
工作职责
1. 利用计算机视觉、语音识别的相关技术,进行音视频语音识别算法的研究工作。
2. 跟进最新的音视频多模语音识别的学术工作,探索音视频多模语音识别的发展方向。
3. 参与音视频多模语音算法的落地研发,有机会直面真实的用户场景。
- 岗位要求
岗位要求:
1. 2021年~2022年取得本科/硕士/博士学历,计算机相关专业优先
2. 具有以下领域之一的技术积累,两个领域都有积累者优先:
1) 计算机视觉:图像视频分类、视频内容分析、文字检测和识别、场景理解、物体追踪等。
2) 语音识别:语音识别、声学模型、信号处理等
3. 熟练掌握一种编程语言吗,如Python等。有一定的编程能力,能够独立实现学术前沿的迁移工作者优先。
4. 作为主要作者,参与发表过音视频多模语音、计算机视觉或语音识别相关学术论文者酌情加分。
5. 沟通能力良好,能够与团队相处融洽