BenchFlowPython 基础设施开发工程师/实习生团队简介BenchFlow 正在构建统一的 AI 基准测试运行时平台。我们托管了全球最大的标准化评估库(如 CMU WebArena、WebCanvas),并通过 API 为企业提供一键式测试服务。职位职责设计可扩展的云端基准测试执行系统优化基于 Python/Node.js 的 AI 工作流运行时性能开发追踪、日志和动态排行榜工具任职要求精通 Python、异步编程和云平台(AWS/GCP)有分布式系统或开发者工具(如 CI/CD)经验[实习生] 计算机科学/工程专业在校生或应届毕业生优先条件了解至少一个AI 智能体框架(LangChain, LlamaIndex)熟悉 SWE-bench、WebArena、MMLU Pro 等基准测试待遇福利全职湾区base $90k-130k/yr, 0.5%-1.5% equity;实习base湾区 $6k/mo全职国内面议;实习base国内¥13k-¥24k参与开发被数千开发者使用的开源工具全职获得高速成长的 AI 基础设施公司期权投递https://dub.link/benchflow-app全栈AI工程师/实习生团队简介我们正在打造 AI 基准测试领域的 "HuggingFace",平台支持从视觉语言模型到 RAG 工作流的全方位评估。团队由美国顶尖大学大厂背景同学组成,目前已获得谷歌首席科学家Jeff Dean,A16z星探基金领投超过一百万美元。职位职责开发基准测试管理/执行的前端界面集成 AI API(OpenAI, Anthropic)与智能体框架实现结果可视化、团队协作等功能任职要求2年以上 React/TypeScript 和 Python 开发经验熟悉Next.js 13.4/14/15之后的编程paradigm有 AI 应用开发经验(智能体、RAG 等)熟悉 REST/GraphQL API 设计优先条件了解评估指标(准确率、延迟等)参与过开源 AI 项目贡献待遇福利全职湾区base $90k-130k/yr, 0.5%-1.5% equity;实习base湾区 $6k/mo全职国内面议;实习base国内¥13k-¥24k开发被 Princeon 研究院和 YC 初创公司使用的产品全职获得高速成长的 AI 基础设施公司期权投递https://dub.link/benchflow-app