美团大模型算法实习一面

1.介绍下transformer的结构
2.如果微调模型出现复读机现象,是什么原因
3.如果微调效果不好,怎么去分析
4.能不能讲一下你对function call的理解
5.问答系统上线,从query到生成回答,花多少时间
6.Agent工具调用你知道怎么训练吗,训练集应该包含哪些,怎么得到训练的数据集
7.假如一个query有两个工具可以调用,训练集应该怎么设计
8.你构造数据集遇到过什么难点,如何解决问题
全部评论

相关推荐

从2024年开始,Agent 开发这个概念就慢慢的火爆了起来,2025更是被称为 Agent 开发元年,经常会在牛客上刷到很多在后端找工作碰壁的同学发帖,要不要学一些 AI 相关的东西,怎么转大模型应用开发。其实这样的观念本身就带有一定的偏差。我之前在红薯做过一段时间的 agent,也是某7k+ star 的 Agent 开发框架 committer,所以我认为我在这上面还是有一点点自己的心得的。误区一:把 Agent 开发和后端拆开来看据我观察,很多同学所谓的转 AI 应用开发,就是用 Spring AI 或者 langchain 去实现了一个 demo(当然现在可能更高级一点GraphRAG,整个可拖拽的工作流之类的)然后没有任何后端的内容,然后放到了简历上,这个行为其实和在简历上写了一个自实现 RPC 框架和自实现网关没有任何区别。AI Agent 是模型工程化应用层最重要的环节,也比我们平常想想的要复杂的多,我们大部分接触的都是业务开发这个场景,比如电商中的智能客服,或者内部的提效工具。这种其实说的不好听一点就是调用 API,本身和其他的业务场景没有一点点区别,所以对于这样的业务开发岗位,不存在从后端转到大模型应用开发,而是说本身就是后端+新场景。本身最重要的就是 数据+prompt+稳定性,那就不存在任何转方向的说法。所以,如果想做这个业务的同学,只要好好看看mcp,planning这样的新概念,然后快点去找一份相关的实习,因为这个最重要的不是你怎么做这个 Agent,而是怎么让这个 Agent 更稳定,可观测,prompt调优等等。也更看重你的服务端开发的相关经验误区二:Agent 开发是不是工资会更高呢,或者更有技术含量,毕竟大家现在都在卷AI?这个就是一个更大的误区了,刚才上面说的这些,一般就是各个业务部门自己在搞,本身不涉及什么技术。所以本质上和后端同学的薪资基本没有区别。比较有技术含量的呢?就是各个大厂的基础架构和中台部门,提供 AI 开发的基础设施,比如阿里百炼,字节火山方舟,快手万擎,这样的模型算法开发平台,Agent开发平台,智能体沙箱,Agent runtime 这些以前鸡架部门做的工作。为业务方提供集成的 Agent 能力,这个会更有技术含量,可能也会有一定的溢价,以及更高的就是做SFT/RL/AI infra 的岗位了,这样的才是 Agent 的薪资天花板所以再回看 AI 落地的相关的岗位的话,其实还是业务和鸡架二选一,或者有的大佬去做infra和强化学习之类的。比起盲目的去追求这个火热的方向,我觉得更重要的是踏踏实实的去学一下这些技术,如果想做 Agent 的话,Agent相关的技术也是日新月异,学一下怎么将 AI 和业务结合,稳定的落地,或者底层的相关技术,我觉得是更重要的。ps:最近好多牛友问我做开源对找工作到底有没有帮助1. 没实习之前一定有,有实习之后并不如实习(除非你是做鸡架的同学)2. 如果为了找工作参加开源,ospp,glcc 是最好的选择3. 用 AI 写 pr 一定要自己本地先看一遍,测一遍再提交
投递快手等公司10个岗位
点赞 评论 收藏
分享
评论
2
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务