岗位职责
岗位职责
参与文档场景的多模态技术研发,包括但不限于:文字公式识别、表格识别、文档解析等。
探索多模态大模型在手机影像、智能推荐、用户交互等场景的应用。
跟踪学术界与工业界前沿技术(如Transformer、Diffusion Models、多模态预训练),推动技术落地。
岗位要求
教育背景:计算机科学、人工智能、电子工程等相关专业硕士或博士在读,2025届及以后毕业生优先。
技术能力:
扎实的编程基础(Python/C++),熟悉PyTorch/TensorFlow等深度学习框架。
熟悉计算机视觉(CNN/Transformer)或多模态技术(CLIP、VideoMAE、Whisper等)。
有视频理解、跨模态对齐、时序建模等相关项目或论文经验者优先。
加分项:
熟悉大模型技术(LLM、多模态大模型)或移动端AI部署(ONNX、TensorRT)。
在顶级会议(CVPR/ICCV/ACL/MM等)发表过相关论文,或Kaggle/天池等比赛获奖。
个人特质:逻辑清晰,对AI技术落地有热情,具备良好的团队协作能力。
岗位要求
岗位要求
教育背景:计算机科学、人工智能、电子工程等相关专业硕士或博士在读,2025届及以后毕业生优先。
技术能力:
扎实的编程基础(Python/C++),熟悉PyTorch/TensorFlow等深度学习框架。
熟悉计算机视觉(CNN/Transformer)或多模态技术(CLIP、VideoMAE、Whisper等)。
有视频理解、跨模态对齐、时序建模等相关项目或论文经验者优先。
加分项:
熟悉大模型技术(LLM、多模态大模型)或移动端AI部署(ONNX、TensorRT)。
在顶级会议(CVPR/ICCV/ACL/MM等)发表过相关论文,或Kaggle/天池等比赛获奖。
个人特质:逻辑清晰,对AI技术落地有热情,具备良好的团队协作能力。