【27届留用实习生】-大模型评测算法-评测与标准中心

薪资面议
算法工程师
上海
不限
4天/周
最少3个月
有转正
我公司正在参加 27届暑期实习2期专场 活动,更多适合你的职位内容,点击前往 活动大厅 查看->
岗位职责
1、负责构建大模型与 Agent 的评测体系与评测平台 2、设计 Agent / LLM Benchmark、任务环境与评测指标 3、研发自动化评测策略,包括 LLM-as-a-judge、execution-based evaluation 等 4、分析 Agent trajectory 与任务执行过程,评估任务成功率与失败模式 5、支持模型对比分析与排行榜(Leaderboard)建设,推动评测体系持续演进
岗位要求
1、计算机、人工智能或相关专业硕士及以上学历 2、扎实的算法基础与工程能力,熟练使用 Python 3、熟悉大模型或 Agent 技术生态(LLM、Tool Use、Agent Framework 等) 4、对模型评测、Benchmark 构建或自动化评测系统有兴趣或相关经验 加分项: 1、参与过 LLM evaluation、benchmark 或评测平台相关项目 2、熟悉常见评测体系或平台,如 HumanEval、SWE-bench、WebArena、Chatbot Arena 等
龙文路129号(国际传媒港L1大楼)
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
上海人工智能实验室
未融资
上海
查看其他 61 个职位