科大讯飞-西安 多语种语音识别研究组招聘实习生

西安ASRPRG实习生招聘 (ASR-LLM/Online方向)

招聘岗位:ASR算法实习生

岗位职责
1. 主导低资源场景下多语言大模型(Multilingual-LLM)的识别效果优化,突破小语种建模技术壁垒
2. 参与基于Mamba-ASR系列工作,开展实时Multilingual-ASR的效果及时延优化工作
3. 推动基于 MoE 架构的实时Multilingual- ASR 系统研发,实现端到端工业级性能
4. 参与完善数据通路,完成数据富集、清洗和训练集/测试集的构造
5. 根据实习阶段的研究成果转化为相关paper

岗位要求
硕士 / 博士在读,计算机科学、电子信息工程或人工智能相关专业
熟悉 Python 编程,熟练掌握 PyTorch框架
熟悉端到端 ASR 系统架构(如 Transformer/Wav2Vec2 等)
熟悉多语言语音识别关键技术(低资源建模、流式解码等)
具备独立设计实验方案及数据分析能力
具备算法实现与分布式训练调优经验优先
以第一作者身份在 ACL/EMNLP/ICASSP 等顶会发表论文优先
有低资源语言 ASR 项目落地经验优先
可连续实习 3个月以上
具备较强的问题定位与解决能力
优秀者可参与国际顶会论文撰写及专利申请

待遇
1. 实习期达到3个月后开启转正评级,根据评级决定转正及后续实习薪资
2. 相对较充裕的A100/800训练资源
3. 转正后薪资在西安非常有竞争力

工作地点:西安

感兴趣的小伙伴,欢迎投递简历:
dicai@iflytek.com
全部评论

相关推荐

面试官全程关摄像头1.自我介绍一下2.React和Vue哪个更熟悉一点3.你在之前那段实习经历中有没有什么技术性的突破(我只是实习了44天工作28天,我把我能说的都说了)4.你封装的哪个表单组件支不支持动态传值5.自己在实习阶段Vue3项目封装过hook吗6.hook有什么作用7.Vue2和Vue3的响应式区别(我说一个是proxy是拦截所有的底层操作,Object.defineProperty本身就是一个底层操作,有些东西拦截不了,比如数组的一些操作还有等等,面试官就说实在要拦截能不能拦截????我心想肯定不行呀,他的底层机制就不允许吧)8.pinia和vuex的区别(这个回答不出来是我太久没用了)9.pinia和zustand的区别,怎么选(直接给我干懵了)(我说react能用pinia吗  他说要用的话也可以)10.渲染一万条数据,怎么解决页面卡顿问题(我说分页、监听滚轮动态加载,纯数据展示好像还可以用canvas画)(估计是没说虚拟表单,感觉不满意)11.type和interface的区别12.ts的泛型有哪些作用(我就说了一个结构相同但是类型不同的时候可以用,比如请求响应的接口,每次的data不同,这里能用一个泛型,他问我还有什么)13.你项目用的是React,如果让你再写一遍你会选择什么14.pnpm、npm、yarn的区别15.dependencies和devdependencies的区别总而言之太久没面试了,上一段实习的面试js问了很多。结果这次js一点没问,网络方面也没考,表现得很一般,但是知道自己的问题了  好好准备,等待明天的影石360和周四的腾讯了  加油!!!
解zj:大三的第一段面试居然是这样的结局
查看15道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务