蚂蚁消费金融-模型基准和评测工程师

毕业时间:2026-11-01~2027-10-31
工作地点:北京,上海,杭州,重庆,成都
职位描述:
1. 评测基准与数据建设:参与构建覆盖多模态、推理、RAG、代码等场景的评测基准,并负责相关评测数据集的策划、构建与质量校验。
2. 自动化评测流程:设计并维护包括准确性、效率、成本在内的评测指标体系,搭建支持持续集成的自动化评测流程。
3. 评测平台与工具研发:参与评测工具与平台的开发,并探索利用AI智能体(Agent)等技术提升数据生产和评测的自动化效率。
4. 性能优化与前沿探索:结合评测任务特点,优化大模型推理框架(如Sglang),提升评测效率;同时跟踪业界前沿评测方法,并应用于实践。

职位要求:
1. 计算机、人工智能、自动化等相关专业;
2. 动手和编程能力优异,精通Python,深入理解机器学习算法与数据结构,熟悉LLM核心算法;
3. 具有良好的学习和沟通能力,有好奇心和责任心,具有钻研精神和团队协作能力;
4. 具有大模型评测、语言大模型、多模态大模型、自然语言处理、AIGC等相关经验优先;
5. 了解主流的大模型评测榜单、评测框架和评测方法优先。

简历投递:nicky.ly@antgroup.com
全部评论

相关推荐

04-28 16:44
我找了个实习,是个初创公司,现在主要人物就两人吧,一个老板一个技术负责人,技术负责人是老板带出来的。老板是9本后面去美国读了硕,好像在美国上过班,后面回国上班在ai部门当头头吧,到24年自己创业,现在因为老板接项目忙不过来了就开始招人了,说五月份有3个实习生,校招社招都在找。我面的是大模型应用开发这个方向。项目的话主要java,还有python做agent例如用openclaw开发。我没怎么学java,对java懂的不多,例如springboot这种框架我也没用过,就本科是ssm做了毕设。薪资跟我说180一天然后有绩效,百分之三十乘以技术负责人打的分,工资一个月一发,绩效说三个月。他是想找能稳定合作的,就是让你一直实习后面转正。然后实习不懂的可以问技术负责人,他说技术负责人非常厉害,但是这个技术负责人他是远程办公的不在公司,因为这个人跟着老板七八年了,老板信任他,然后技术也非常硬,老板现在忙着谈生意,项目的实现主要还是技术负责人。跟我说了三个项目吧,一个纯java的,还有一个用openclaw开发法律助手,还有一个无人机什么的,那个感觉是java加深度学习视觉检测的。他说往全栈发展,就是啥都要会,前端后端agent啥啥啥的。暂时能回忆到的就这些,信息太多了大家觉得怎么样?要不要去?
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务