算法打工人阿旺 level
获赞
299
粉丝
338
关注
0
看过 TA
2035
中山大学
2026
算法工程师
IP属地:山东
高级算法工程师,多模态/大模型/搜广推方向辅导
私信
关注
1.自我介绍2.拷打项目:针对长短期记忆,讲讲你是如何设计记忆的提取、压缩与冲突更新机制的?如果检测到用户存在极端情绪,你的Agent如何在不中断对话流的前提下进行干预?3.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?6.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?8.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?9.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?10.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?11.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?15.手撕:第k大元素20.反问📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看16道真题和解析
0 点赞 评论 收藏
分享
1️⃣讲一下强化学习 reward 函数设计。(1)可验证奖励( RLVR ):对有确定答案的任务(数学、代码),用 ground - truth 结果验证(正确+1,错误0/-1)。(2)奖励模型( RM - based Reward ):对主观任务(对话、写作),训练 RM 从偏好数据学习打分。(3)规则奖励:对特定安全/格式要求,用硬规则直接判断。2️⃣现有 Embedding 模型相比 CLIP 的区别?(1)训练目标不同: CLIP 用 InfoNCE 做图文对比,目标是让匹配图文对相似;专用模型用 SimCSE /三元组损失/ NLI 监督/多任务,目标是精确捕捉文本语义的细粒度差异。(2)数据质量不同:专用模型训练于高质量语义标注对,语义标注精准; CLIP 训练于网络爬取图文对,文本侧噪声大、以短标题为主,不利于文本语义建模。(3)性能对比: MTEB 基准上, BGE - Base /E5- Base 等在文本检索、语义相似度等任务上大幅领先 CLIP ;但 CLIP 在图文检索上仍有独特优势。3️⃣ GRPO 和 PPO 的区别。(1)架构差异: PPO 需要四个模型(策略模型π t _0、旧策略、奖励模型 RM 、价值模型 Critic ),显存占用大, Critic 的估计偏差还可能干扰 advantage 计算。 GRPO 只需策略模型,对每个 prompt 采样 G 个输出,用组内平均奖励作为 baseline 替代 Critic ,去掉了价值模型的全部开销。(2) Baseline 设计: PPO 的 baseline 是 Critic 预测的状态价值; GRPO 的 baseline 是当前 prompt 下同组 G 个 rollout 的均值。(3)适用场景: GRPO 对"组内多样性"要求高,特别适合有可验证奖励的推理任务; PPO 更通用但更复杂,适合需要精确价值估计的场景。4️⃣大模型训练流程。(1)预训练( Pre - training ):目标是从海量无标注文本(万亿 token 级别)学习语言统计规律和世界知识,任务是 next - token prediction 。(2)监督微调( SFT ):用高质量( instruction , response )对让模型学会遵循指令。(3)对齐训练( RLHF / DPO / GRPO ):让模型输出符合人类偏好,通过奖励模型反馈或直接偏好优化进一步提升质量和安全性。5️⃣微调大模型如何卡阈值。可验证任务(数学/代码)用"正确性"作为硬阈值(只要正确的);生成任务用 RM 综合分数阈值。6️⃣为什么 CLIP 的嵌入效果不好?①文本编码器仅支持77 tokens (基于 GPT -2架构),无法处理长文本;② nfoNCE 对比目标只要求"匹配图文对靠近",不需要区分文本之间的细粒度语义差异,嵌入空间对文本相似度分辨能力弱;③预训练数据以互联网短标题为主,语义噪声大,文本侧质量不足;④对文本扰动敏感(微小改动可能导致检索排序大变)。7️⃣[代码题]手撕了 InfoNCE 代码 InfoNCE loss 的实现﹣﹣计算相似度矩阵(点积/余弦)、温度缩放、对角线为正样本的 cross - entropy loss ,批次内负样本。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看7道真题和解析
0 点赞 评论 收藏
分享
🌟首先提升Agent 质量:1️⃣Prompt Engineering 是被低估的核心技能。 Agent 的 system prompt 和 tool description 的写法直接决定了 LLM 的决策质量。一个精心设计的 tool description,可以让 LLM 在 90% 的情况下正确选择工具;一个随手写的,可能只有 60%。这个差距不是换框架能弥补的。2️⃣Evaluation 是最容易被忽视的环节。 Agent 的行为具有不确定性,同样的输入可能产生不同的执行路径和结果。你需要一套 evaluation 体系来衡量 Agent 在什么条件下表现好、什么条件下会翻车。没有 eval 的 Agent 开发就是在盲人摸象。3️⃣上下文工程(Context Engineering)正在取代 Prompt Engineering 成为新的关键词。 它关注的是一个更大的问题:在 Agent 的每一步决策中,如何精准地组装出最有利于 LLM 做出正确判断的上下文?哪些信息该放进去,哪些该丢掉,以什么格式组织,这些决策比你选哪个框架重要一百倍。4️⃣用户体验设计不可忽略。 Agent 不是对每个任务都能完美完成的。如何让用户理解 Agent 在做什么、如何设置合理的预期、如何在 Agent 失败时优雅地降级——这些产品层面的思考往往比技术实现更难。🌟分阶段的选型策略1️⃣入门期:拿框架快速上手。选最流行的框架,跑通第一个 demo。目标不是做出好产品,而是理解 Agent 的基本工作原理。用框架的好处是屏蔽底层细节,专注于理解"ReAct 循环"这个核心概念。2️⃣进阶期:脱离框架理解本质。自己用纯 API 调用手写一个最小的 Agent。用 openai 或 anthropic 的官方 SDK,50 行代码写一个能调工具的 ReAct 循环。这个练习会让你彻底明白框架帮你做了什么、没做什么。3️⃣生产期:用框架的方式要利于拆除。如果你继续用框架,把它当作一个 LLM 调用的便利层来用,不要在它的 Agent 抽象上构建核心逻辑。如果你选择不用框架,直接用官方 SDK + 自己封装的薄层,也完全可行。代码量不会比用框架多太多,但可控性高出几个量级。⭕最后框架选型是一个"入口问题"——刚入门时你会觉得它很重要,深入之后你会意识到它只是一个起点。Agent 开发的真正挑战在于:理解 LLM 的能力边界,设计合理的任务分解策略,构建鲁棒的执行和容错机制,以及在不确定性中找到产品价值。这些事情,没有任何框架能替你想清楚。Agent 的灵魂不在框架里,在你对问题的理解里。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
0 点赞 评论 收藏
分享
一、OpenClaw 是什么?OpenClaw(前身 Clawdbot / Moltbot)是由 PSPDFKit 创始人 Peter Steinberger 于 2025 年 11 月创建的开源本地 AI Agent 项目,截至 2026 年初 GitHub 星标超 22 万。它运行在用户本地设备上,支持 Claude、GPT-4o、Ollama 等多种 LLM,可通过 WhatsApp、Telegram、Slack 等平台交互。Skills 就是 OpenClaw 的能力扩展系统。二、Skills 的核心概念Skills 是Markdown格式的操作手册,教 Agent 如何组合工具完成特定任务。三、Skill 的文件结构最小只需一个文件,完整结构如下:my-skill/├── SKILL.md           # 核心文件(必需):YAML 元数据 + Markdown 指令├── scripts/           # 可选:辅助脚本(Python、Bash 等)├── references/        # 可选:补充文档└── install.sh         # 可选:安装脚本四、加载与触发机制✅触发流程Agent 启动时将精简的 Skill 清单(name + description + path)注入 System Prompt。用户发消息后,LLM 根据 description 判断相关性,匹配则按需读取完整 SKILL.md 执行。这是纯文本驱动的架构——Skills 不是编译代码,而是 Markdown 指令。✅Gating(准入过滤)加载时检查:环境变量是否存在、CLI 工具是否在 PATH 中、平台是否匹配、配置中是否禁用、Tool Policy 是否放行。不满足条件的 Skill 不会加载。✅Token 开销每个 Skill 在 System Prompt 中约占 97 字符 + 字段长度(约 24+ tokens)。Skill 太多会增加响应延迟,建议合并同领域的小 Skill。五、ClawHub:Skill 注册中心ClawHub(clawhub.ai)是官方 Skill 注册中心,定位类似 npm 之于 Node.js。截至 2026 年 2 月底托管超 13,700 个社区 Skills,支持向量语义搜索、版本管理、星标评论和安全审核。六、创建自定义 Skill编写 SKILL.md 的核心原则:description 是触发短语,不是广告文案。 要包含用户实际会说的词,如 "log summary"、"deploy checklist"正文要像凌晨 3 点交给值班工程师的操作清单。 确定性步骤、停止条件、明确的输出格式不要写长篇介绍。 Agent 不需要"了解背景",它需要知道"现在做什么"在 openclaw.json 中配置启用和环境变量后,OpenClaw 自动识别新 Skill(支持文件监听热更新)。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
0 点赞 评论 收藏
分享
目前主流的 Embedding 模型都是 Bi-Encoder 架构(双塔模型):query 和文档各自独立编码成向量,再算余弦相似度。这种架构的优势是速度快——文档向量可以离线算好存起来,查询时只需要算一次 query 的向量就能跟整个库比对。代价是精度不如 Cross-Encoder,所以才需要两阶段检索。✴️下面是目前开源社区里最常用的几个 Embedding 模型的核心对比:✅BGE-M3(BAAI 智源):目前中文场景的首选。支持中英多语言,最大 8192 token 的上下文窗口,同时支持稠密向量、稀疏向量和 ColBERT 式多向量检索三种模式。在 MTEB 中文榜单上长期稳居前列。如果你不知道选什么,无脑选 BGE-M3 不会错。✅BGE-large-zh(BAAI 智源):专注中文的大尺寸版本,在纯中文场景下精度略高于 M3,但不支持多语言,上下文窗口也只有 512 token。适合纯中文且文档较短的场景。✅GTE-multilingual-base(阿里达摩院):阿里出品的多语言 Embedding 模型,在 MTEB 多语言榜单上表现很强。跟 BGE-M3 是直接竞品关系,两者在多语言场景下各有胜负。如果你面的是阿里,了解 GTE 是基本功。✅E5-small/base/large(微软):微软出品,特点是有从 small 到 large 的完整尺寸梯度,small 版本只有 33M 参数,特别适合资源紧张或需要部署到边缘设备的场景。精度比 BGE 略低,但推理速度快很多。✅Jina Embeddings v2(Jina AI):最大亮点是支持 8K token 的超长上下文。如果你的文档 chunk 特别长(比如整段法律条文或完整的技术文档章节),其他模型可能截断,Jina v2 能全部吃进去。✅MiniLM(微软):极致轻量级,速度最快,适合对延迟要求极高或大批量处理的场景。精度是这几个里最低的,但胜在快。🌟四种经典搭配方案1️⃣经典流水线:BGE-base2️⃣检索 Top 100 → BGE-Reranker-base3️⃣精排多语言场景:GTE-multilingual-base + GTE-multilingual-rerankerGPU4️⃣紧张:E5-small + MiniLM-L6-cross-encoder(batch 推理)5️⃣长文档 / 8K:Jina-embeddings-v2 + Jina-ColBERT-v2,段内匹配更稳📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务