智能筛选好 offer

05-27 18:42 门头沟学院人工智能

关注

阿里AI开发5.27一面

一面大概1小时左右，主要是问项目的细节和难点
下文结构是怎么组织的？有没有进行长度约束？
Agent.md和memory.md的职责区分都是什么？
skills.md的结构内容有什么？
生成长期记忆的话，Prompt是怎么组织的？
怎么衡量效果？评测怎么做？
对ai工具的看法-排名，日常使用什么，项目使用的比列占多少？
ai coding：做了一个【提取目标人群的引擎】，还行不算难
希望能有后续吧 #发面经攒人品#

全部评论

推荐最新楼层

武汉大学算法工程师

有后续吗

点赞回复分享

发布于昨天 16:16 湖北

05-27 17:27

已编辑

腾讯_后端开发实习生(实习员工)

来🦢的第一个需求就是3000行skill

在我来鹅之后，接到的第一个完整大需求就是需要编写一个skill，之前的实习也写过一些skill，但是在我的理解中skill就是跟提示词没差，把你需要的目标全写上就好了，所以第一次mr我提交了一个超过1200行的md，被mt打了回去，为了完成这个需求，我又赶紧请教了我身边的大神同学，获取一些写skill的经验，将原先1200行的md进行了对应的references拆封，又通过我朋友教我的验证机制验证这个skill的效果，最后完成了我的第一个需求。正好前两篇文章给大家分享了写好的用来包装简历的skill，那么今天来给大家分享怎么去写一个好的，可以实际用来工作的skill，摆脱只会写提示词的尴尬。构建 Skill 的五个步骤Step 0：先写 EvalsEval（Evaluation，评估）是一套结构化的、可重复运行的测试用例集，用来判断 Skill 的表现是否符合预期。它不是泛指&quot;测试一下&quot;，而是开发 Skill 的前提条件。一个典型的 Skill eval 集至少包含三类用例：- 正例（Positive）：用户说“帮我看一下这个 PR 能不能合”，验证 Skill 应该被加载- 负例（Negative）：用户说“帮我把代码格式化一下”，验证 Skill 不该被加载——路由别跑偏到不该触发的地方- 边界（Edge）：“这个 PR 改了一行日志，要不要审”，验证边界情况下的路由行为正例和负例都要写，而且负例往往比正例更值钱——误触发是 Skill 路由的头号失败模式。Eval 不只是测一次。Perplexity 的 eval 分三个层次：如下图每种都要在 GPT、Claude Opus、Claude Sonnet 不同的 orchestration 模型上分别跑——Sonnet 和 GPT 的 Skill 行为差异很大，只在一种模型上过了不够。没有 evals，你改 description 就是在盲改，一个新 Skill 也可能悄悄搞坏已有的十个 Skill。Step 1：写 Description（最难的一行）description 是路由触发器，不是文档。写好它不需要关心 Skill 的内容，只需要关心能不能在正确的时间加载、有没有意外触发到不应该触发的地方——误触发是头号失败模式，每加一个 Skill 都有可能让其他 Skill 变差。糟糕的 description 描述 Skill 做什么，好的 description 说什么时候加载。举个监控 PR 的例子：不要写这个 Skill 做什么，要写工程师感到焦虑时会说什么——"babysit"、"watch CI"、"make sure this lands"。快速检查清单：- 以"Load when…"开头- 控制在 50 词以内- 描述用户意图，最好来自真实查询- 不总结工作流程Step 2：写 Body跟同事讲工作流程和跟 LLM 讲工作流程完全是两回事。对几乎任何面世超过一年的软件工具，只要提名字，模型已经知道怎么用。所以跳过模型已经懂的部分。不用写出每一步命令。比如不要写 git log → git checkout main → git checkout -b clean-branch → git cherry-pick commit。写 "Cherry-pick the commit onto a clean branch. Resolve conflicts preserving intent. If it can't land cleanly, explain why." 模型在后者上表现好得多，尤其是事情不按预期走的时候。太规定的指令比灵活的指令更脆弱。然后聚焦 gotchas 和反例，它们是最高信噪比的内容。每次 Agent 搞砸了就加一条，gotcha 会自然地累积起来。条件逻辑或内容太重的东西移出 SKILL.md，放到 accessory file 里渐进加载。Step 3：用层级结构- scripts/ —— 确定性逻辑，模型不用每次重新发明- references/ —— 重型文档，条件触发才读（"如果 API 返回非 200，读 api-errors.md"）- assets/ —— 输出模板，模型直接复制填充- config.json —— 首次运行设置，问一次保存下来对于极其复杂的 Skill，进一步考虑是否应该拆成一组 Skill，用 depends: 声明加载关系。Step 4：迭代切分支出来，在无 Skill 的状态下跑 hero query（核心用户场景查询），建 eval 集，反复调。提交 review 时最好一个 changeset 里自带 eval 集。Description 里的小词改动对路由影响很大，甚至会 spillover（溢出）到其他 Skill，所以这些在 Step 5 之前做完。Step 5：发布大家快把这5步实行起来，成为写skill专家吧！

琉璃梦忆：直接skill creator 管你这那的

AI了，我在打一种很新的...

点赞评论收藏

分享

昨天 10:20

第一拖拉机制造厂拖拉机学院 Java

你说你用Claude，你用的是 CLI，还是 Agent、Opus？

像 Claude，不仅有网页版，还有 Claude APP，以及 Claude Code，他们之间到底有什么区别，和 Agent 有什么关系，和 CLI 又有什么关系呢？  今天就来给大家详细的盘点一下，搞清楚，装比的时候咱也有底气😄。  系好安全带，我们粗粗粗粗发～  我画了一张图，大家瞅一眼就能知道个大概。 就能理解为什么同一个 Claude，在不同地方用起来体验差距会这么大。  最底层是模型层。Opus 4.7、Sonnet 4.6、DeepSeek V4、GLM-5.1、GPT-5.5，这些都是模型。 模型就是发动机，决定了这辆车的马力上限。Opus 4.7 是 V12 双涡轮，So...

如何成为1个AI工程师？

点赞评论收藏

分享

05-27 18:52

西南大学后端工程师

和顺慧康-AI应用开发

base北京，依托东软集团和中关村发展集团背景的智慧康养科技企业，为政府、企业和康养机构提供智慧化健康养老产品与服务。腾讯会议-25min1. 自我介绍（强调介绍重点在AI工具的使用上）2. 列举一下你电脑安装的跟AI、Agent、大模型相关的软件和工具（共享屏幕展示）3. 关于Cursor IDE的使用，您是通过官方渠道自行注册，还是通过其他途径获取的账号？4. 目前订阅的是哪个版本？5. 在涉及地区限制时，你采取什么方式来保障AI开发工具的顺畅访问？6. 使用Trae进行编码时，你倾向于手动指定特定的底层大模型，还是直接使用系统默认的“Auto”模式？背后的考量是什么？7. 你在使用过程中有用它做前端界面的设计到实现吗？（从需求到ui设计最后到代码生成的过程）8. 回顾你的项目经历，在使用AI集成开发工具或直接调用API实现业务功能时，遇到过哪些AI无法直接解决或存在显著局限性的难点？你是如何突破这些瓶颈的？9. 在你看来，普通Vibe Coding（直觉/自然语言驱动编码）模式与SOLO（智能体自主规划执行）模式的核心区别是什么？在实际开发中如何抉择？10. 看到你屏幕上的界面，AI聊天框的提示：输入&quot;/&quot;获取更多能力，如&quot;/spec&quot;,&quot;/plan&quot;。你是否了解这两个指令的具体含义？在实际编码过程中是否有过实际应用？11. 如果让你从零设计一个RAG（检索增强生成）系统，你认为必须包含哪些核心模块？请简述各模块的关键职责。12. Spring AI Alibaba、AgentScope-Java这两个框架有了解吗？知道两者在定位、适用场景及核心能力上的主要区别吗？13. 简单介绍如何解决高并发的抢单，通过什么形式来实现？该方案为何能有效保证数据的一致性？14. 在使用Redisson实现分布式锁时，被锁定的对象究竟是什么？是数据库中的一条记录、业务层面的某个Key，还是具体的用户实体？请结合业务语义进行解释。15. 订单ID的生成时机应如何设计？是采用预生成策略，还是在业务流程中实时生成？这两种方式对高并发下的性能有何影响？16. 分布式锁的防并发效果是否仅限于当前系统内部？如果引入另一个外部系统直接连接同一数据库，原有的锁机制是否依然有效？为什么？17. 死信队列（DLQ）是什么？它在分布式系统中主要承担什么角色，通常应用于哪些异常处理场景？反问环节1. 请问目前公司整体研发团队的规模是怎样的？内部是如何进行职能划分或项目组编制的？2. 公司和东软集团的关系是？3. 公司目前核心的研发业务聚焦在哪些垂直领域？在产品工程解决方案与行业定制化服务之间，目前的业务重心更偏向哪一端？4. 面对当前生成式AI技术的快速迭代，公司是从何时开始系统性布局AI转型的？感想:有一周没面试了，感觉水平下降了很多，八股 项目 算法还是得多看看

发面经攒人品

点赞评论收藏

分享

05-25 15:35

已编辑

内蒙古师范大学人工智能

Ai Agent、ai应用开发面经面试题2

一些自己在网上搜刮的面经题目路过的牛爷爷可以试着答一答，附上自己的答案，如果有更好的答案也可以拷打我，如果有别的比较好的题目也可以评论里发一发。 如何评估 RAG 效果？指标是什么？ 分层评估：  检索质量评估：看如HitRate（命中率），Recall（召回率）等指标 生成质量评估：看如相关性（是否切题）、忠诚度（生成是否基于检索内容生成）、完整性（生成答案是否完整） 用户满意度测评：答案是否满意，检索速度够不够块。  RAG 和微调怎么取舍？ RAG适合更新频率高，存在隐私数据以及需要可解性性要求高需要稳定输出的场景。 微调适合需要特定规则以及语气的使用场景。 这两个技术在大部分场景下都不...

查看8道真题和解析

点赞评论收藏

分享

05-27 18:08

门头沟学院芯片研发

我在公司将谨慎使用AI

做梦也会成功的：真是Token比人贵

点赞评论收藏

分享

评论

8

10

招聘动态

快手

27届实习超多转正机会

27届校招宝典

网申助手插件

校招信息网申列表

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

999136次浏览 5081人参与

# 国企是春招机械人最好的去处吗 #

153920次浏览 585人参与

# 发面经攒人品 #

8873541次浏览 98477人参与

# 硬件人的简历怎么写 #

350892次浏览 3147人参与

# 27届实习投递记录 #

163627次浏览 1663人参与

# AI了，我在打一种很新的工 #

208711次浏览 2238人参与

# 万物皆可发面经 #

4724次浏览 58人参与

# 实习，不懂就问 #

229557次浏览 1763人参与

# 运营人求职交流聚集地 #

260328次浏览 1135人参与

# 秋招投递攻略 #

296098次浏览 2643人参与

# 你的mentor是什么样的人？ #

67260次浏览 852人参与

# 实习生至暗时刻 #

93716次浏览 942人参与

# 实习如何「偷」产出？ #

772563次浏览 8615人参与

# 从mentor身上学到了__ #

67753次浏览 949人参与

# 父母对你找工作是助力还是阻力？ #

52752次浏览 467人参与

# 你觉得mentor喜欢什么样的实习生 #

64190次浏览 1090人参与

# 我和mentor的爱恨情仇 #

121596次浏览 1047人参与

# 非技术投递记录 #

741718次浏览 6979人参与

# 找实习记录 #

282583次浏览 1664人参与

# 第一次找实习，我建议__ #

90038次浏览 923人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务