🌟团队介绍:我们是淘宝直播AIGC算法团队,致力于打造业界领先的电商直播数字人。在这里,你将有机会参与前沿的语音大模型算法研发和商业场景真实落地,用技术定义未来直播电商的交互体验。💡职位描述:面向淘宝直播数字人场景,研究探索语音大模型等前沿技术,提升技术影响力:1.负责语音大模型等前沿算法研究,包括语音对话系统、语音理解与生成、语音强化学习等方向,参与架构设计、训练调优及迭代工作;2.负责端到端语音交互模型的前沿探索,优化数字人全双工语音交互架构,包括智能打断、上下文感知、情感交互理解、流式输入输出等,解决级联模型等语义割裂与延迟问题;3.负责高表现力语音合成算法探索,参与数字人TTS系统研发,包括多情感、高表现力的电商直播感染力语音建模,实现语音、重音、情感的动态可控;4.参与团队合作,与团队一起解决技术难题,推动技术落地,产出高质量学术论文和专利。🛠️职位要求:1.计算机、人工智能、信号处理、自动控制等相关专业背景的在读硕士或博士;2.扎实的算法和编程能力,熟练掌握 Python 编程及 PyTorch/TensorFlow 等主流深度学习框架;3.在语音多模态大模型某一领域(Voice Agent / 语音合成 / 语音识别等)有相关经验,对相关算法模型和优化有深刻理解;4.在 ICASSP、Interspeech、NeurIPS、CVPR 等顶会发表过论文者优先;有数字人、虚拟主播或语音交互相关项目经验者优先。工作地点: 杭州/北京简历投递: duzongwei.dzw@taobao.com