岗位职责
1. 负责文档解析大模型,探索基于大模型的文档解析方案,优化大模型并构建数据工程,在多样性文档上落地应用,打造有行业影响力的文档大模型。
2. 负责文档解析相关算法及工具研发,研究方向包括但不限于OCR、公式检测、公式识别、表格识别、布局检测、大模型文档提取算法、RAG算法研发等。
3. 设计并优化文档解析相关算法,要求针对实际业务数据上速度及精度超过开源SOTA,达到业界领先水准。
4. 与开发团队紧密合作,将算法成果落地到实际产品中(如MinerU),并为内部团队提供高质量文档解析内容。
5. 持续关注最新研究动向,在高质量会议及期刊上发表高水平论文,打造和提升行业技术影响力。
岗位要求
1. 硕士及以上学历,专业方向为计算机视觉、自然语言处理、多模态、机器学习等,博士优先。
2. 较强的动手和编程能力,熟练掌握Python/C++等编程语言及Pytorch/Tensorflow等深度学习开发框架,有GitHub热门项目经验及高水平竞赛优异成绩者优先。
3. 在计算机视觉、自然语言处理等相关方向顶会或者顶刊上以一作身份发表过学术论文,具备扎实的代码功底和工程能力。
4. 在以下研究方向有深入研究或丰富工作经验:智能文档处理(OCR、公式识别/检测、Layout检测、文档大模型等)、多模态大模型研究,Data-Centric研究、大模型数据质量研究。
5. 具备良好的沟通表达能力、团队协作意识、针对关键技术难度的攻坚能力以及一定的抗压能力。