AI评测开发实习生
薪资面议
测试其它 北京 不限 5天/周 最少6个月 有转正

岗位职责
1、参与多模态大模型评测体系建设,包括但不限于文本、语音、图片、视频生成等多模态模型/Agent等,制定评测方案、评测指标、构建评测集,形成行业基准;
2、开发自动化、可扩展、可靠的评测系统,提高自动评估的占比,缩短评测周期;
3、针对阶段性迭代重点、行业变化,构建和动态调整评测集,持续探索模型/Agent能力边界;
4、对模型/Agent能力深度分析,明确当前版本的优势与缺陷,拦截能力下限问题;
5、持续追踪大模型行业发展,对重点版本模型/Agent进行横向对比评测,量化行业能力水平
岗位要求
1、2027届及以后毕业,本科及以上学历,计算机、数学等相关专业优先;
2、熟悉python、go等编程语言,有较强的工程能力;
3、具有出色的分析、解决问题的能力,有自主探索解决方案的能力者;
4、有模型、Agent、AI产品评测经验者优先;
5、对模型评测充满兴趣,对开源benchmark数据集有研究经验者优先
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报