阿里AI开发5.27一面

一面大概1小时左右,主要是问项目的细节和难点
下文结构是怎么组织的?有没有进行长度约束?
Agent.md和memory.md的职责区分都是什么?
skills.md的结构内容有什么?
生成长期记忆的话,Prompt是怎么组织的?
怎么衡量效果?评测怎么做?
对ai工具的看法-排名,日常使用什么,项目使用的比列占多少?
ai coding:做了一个【提取目标人群的引擎】,还行不算难
希望能有后续吧 #发面经攒人品#
全部评论
有后续吗
点赞 回复 分享
发布于 昨天 16:16 湖北

相关推荐

在我来鹅之后,接到的第一个完整大需求就是需要编写一个skill,之前的实习也写过一些skill,但是在我的理解中skill就是跟提示词没差,把你需要的目标全写上就好了,所以第一次mr我提交了一个超过1200行的md,被mt打了回去,为了完成这个需求,我又赶紧请教了我身边的大神同学,获取一些写skill的经验,将原先1200行的md进行了对应的references拆封,又通过我朋友教我的验证机制验证这个skill的效果,最后完成了我的第一个需求。正好前两篇文章给大家分享了写好的用来包装简历的skill,那么今天来给大家分享怎么去写一个好的,可以实际用来工作的skill,摆脱只会写提示词的尴尬。构建 Skill 的五个步骤Step 0:先写 EvalsEval(Evaluation,评估)是一套结构化的、可重复运行的测试用例集,用来判断 Skill 的表现是否符合预期。它不是泛指"测试一下",而是开发 Skill 的前提条件。一个典型的 Skill eval 集至少包含三类用例:- 正例(Positive):用户说“帮我看一下这个 PR 能不能合”,验证 Skill 应该被加载- 负例(Negative):用户说“帮我把代码格式化一下”,验证 Skill 不该被加载——路由别跑偏到不该触发的地方- 边界(Edge):“这个 PR 改了一行日志,要不要审”,验证边界情况下的路由行为正例和负例都要写,而且负例往往比正例更值钱——误触发是 Skill 路由的头号失败模式。Eval 不只是测一次。Perplexity 的 eval 分三个层次:如下图每种都要在 GPT、Claude Opus、Claude Sonnet 不同的 orchestration 模型上分别跑——Sonnet 和 GPT 的 Skill 行为差异很大,只在一种模型上过了不够。没有 evals,你改 description 就是在盲改,一个新 Skill 也可能悄悄搞坏已有的十个 Skill。Step 1:写 Description(最难的一行)description 是路由触发器,不是文档。写好它不需要关心 Skill 的内容,只需要关心能不能在正确的时间加载、有没有意外触发到不应该触发的地方——误触发是头号失败模式,每加一个 Skill 都有可能让其他 Skill 变差。糟糕的 description 描述 Skill 做什么,好的 description 说什么时候加载。举个监控 PR 的例子:不要写这个 Skill 做什么,要写工程师感到焦虑时会说什么——"babysit"、"watch CI"、"make sure this lands"。快速检查清单:- 以"Load when…"开头- 控制在 50 词以内- 描述用户意图,最好来自真实查询- 不总结工作流程Step 2:写 Body跟同事讲工作流程和跟 LLM 讲工作流程完全是两回事。对几乎任何面世超过一年的软件工具,只要提名字,模型已经知道怎么用。所以跳过模型已经懂的部分。不用写出每一步命令。比如不要写 git log → git checkout main → git checkout -b clean-branch → git cherry-pick commit。写 "Cherry-pick the commit onto a clean branch. Resolve conflicts preserving intent. If it can't land cleanly, explain why." 模型在后者上表现好得多,尤其是事情不按预期走的时候。太规定的指令比灵活的指令更脆弱。然后聚焦 gotchas 和反例,它们是最高信噪比的内容。每次 Agent 搞砸了就加一条,gotcha 会自然地累积起来。条件逻辑或内容太重的东西移出 SKILL.md,放到 accessory file 里渐进加载。Step 3:用层级结构- scripts/ —— 确定性逻辑,模型不用每次重新发明- references/ —— 重型文档,条件触发才读("如果 API 返回非 200,读 api-errors.md")- assets/ —— 输出模板,模型直接复制填充- config.json —— 首次运行设置,问一次保存下来对于极其复杂的 Skill,进一步考虑是否应该拆成一组 Skill,用 depends: 声明加载关系。Step 4:迭代切分支出来,在无 Skill 的状态下跑 hero query(核心用户场景查询),建 eval 集,反复调。提交 review 时最好一个 changeset 里自带 eval 集。Description 里的小词改动对路由影响很大,甚至会 spillover(溢出)到其他 Skill,所以这些在 Step 5 之前做完。Step 5:发布大家快把这5步实行起来,成为写skill专家吧!
琉璃梦忆:直接skill creator 管你这那的
AI了,我在打一种很新的...
点赞 评论 收藏
分享
base北京,依托东软集团和中关村发展集团背景的智慧康养科技企业,为政府、企业和康养机构提供智慧化健康养老产品与服务。腾讯会议-25min1. 自我介绍(强调介绍重点在AI工具的使用上)2. 列举一下你电脑安装的跟AI、Agent、大模型相关的软件和工具(共享屏幕展示)3. 关于Cursor IDE的使用,您是通过官方渠道自行注册,还是通过其他途径获取的账号?4. 目前订阅的是哪个版本?5. 在涉及地区限制时,你采取什么方式来保障AI开发工具的顺畅访问?6. 使用Trae进行编码时,你倾向于手动指定特定的底层大模型,还是直接使用系统默认的“Auto”模式?背后的考量是什么?7. 你在使用过程中有用它做前端界面的设计到实现吗?(从需求到ui设计最后到代码生成的过程)8. 回顾你的项目经历,在使用AI集成开发工具或直接调用API实现业务功能时,遇到过哪些AI无法直接解决或存在显著局限性的难点?你是如何突破这些瓶颈的?9. 在你看来,普通Vibe Coding(直觉/自然语言驱动编码)模式与SOLO(智能体自主规划执行)模式的核心区别是什么?在实际开发中如何抉择?10. 看到你屏幕上的界面,AI聊天框的提示:输入"/"获取更多能力,如"/spec","/plan"。你是否了解这两个指令的具体含义?在实际编码过程中是否有过实际应用?11. 如果让你从零设计一个RAG(检索增强生成)系统,你认为必须包含哪些核心模块?请简述各模块的关键职责。12. Spring AI Alibaba、AgentScope-Java这两个框架有了解吗?知道两者在定位、适用场景及核心能力上的主要区别吗?13. 简单介绍如何解决高并发的抢单,通过什么形式来实现?该方案为何能有效保证数据的一致性?14. 在使用Redisson实现分布式锁时,被锁定的对象究竟是什么?是数据库中的一条记录、业务层面的某个Key,还是具体的用户实体?请结合业务语义进行解释。15. 订单ID的生成时机应如何设计?是采用预生成策略,还是在业务流程中实时生成?这两种方式对高并发下的性能有何影响?16. 分布式锁的防并发效果是否仅限于当前系统内部?如果引入另一个外部系统直接连接同一数据库,原有的锁机制是否依然有效?为什么?17. 死信队列(DLQ)是什么?它在分布式系统中主要承担什么角色,通常应用于哪些异常处理场景?反问环节1. 请问目前公司整体研发团队的规模是怎样的?内部是如何进行职能划分或项目组编制的?2. 公司和东软集团的关系是?3. 公司目前核心的研发业务聚焦在哪些垂直领域?在产品工程解决方案与行业定制化服务之间,目前的业务重心更偏向哪一端?4. 面对当前生成式AI技术的快速迭代,公司是从何时开始系统性布局AI转型的?感想:有一周没面试了,感觉水平下降了很多,八股 项目 算法还是得多看看
发面经攒人品
点赞 评论 收藏
分享
做梦也会成功的:真是Token比人贵
点赞 评论 收藏
分享
评论
8
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务