02-12 16:11 黑龙江大学 Java 发布于山东

关注

agent实习都干什么？深入了解项目构成(二)

在前文agent实习都干什么？深入了解项目构成(一) 对日常工作进行了大概的分享后，本文是我在工作中对于方案设计的一些小思考和对于架构的粗浅理解，希望和大家共同讨论进步(完全脱敏)。

一、方案设计(以敏感词为例)

敏感词审核作为功能模块的组成，其本身多聚焦于与文档进行交互，需同时满足“实时响应”和“高覆盖率”，因此架构设计阶段确定AC自动机+AI双轨方案：

AC自动机做基础筛查：合同审核场景下敏感词库规模庞大，AC自动机针对文档识别时间复杂度为O(n)（n为文档长度），能以低于10s的延迟完成固定敏感词的字面匹配，满足高并发下的效率要求，但仅能识别精准匹配的词汇，无法处理谐音、变体或语义衍生的隐性违规表达，同时受限于本身机制，仅能匹配完整的敏感词，如果存在AABB和AA类型的敏感词，则AA通常无法识别。
AI做补充校验：基于行业微调的大模型能识别“套现→套取现金”等语义衍生违规、“氵包娼”等变体表达，弥补AC自动机的覆盖率短板；双轨结果交叉验证，既保证基础审核效率，又将敏感词漏检率降低80%以上。

二、文档切块策略：语义切块+最长一页限制

在POI解析文档内容、AI模型处理文本的全流程中，token限制是核心约束：

token限制的核心影响：一方面，POI解析长文档时，单次处理过长篇幅易导致内存溢出；另一方面，主流大模型（如Qwen3、deepseek）存在token上限（如4096），超出上限会触发截断，导致上下文丢失。
语义切块+最长一页的设计逻辑：按语义切块：以段落、条款为最小单位拆分文档，避免将“合同有效期”“违约责任”等完整语义单元截断，防止AI误判或POI解析遗漏关键信息；最长一页限制：单块内容最长不超过一页（约500-800字），既保证单块token数远低于模型上限（预留冗余空间），又控制切块数量，避免多次调用AI导致响应延迟增加。

三、AI效果评估体系

在agent开发中，目前的测试方法极多，如困惑度测试等等，但在指定任务中，通常采取传统评估方法，即通过多维度评估指标量化审核效果，：

核心指标：精准率（避免误判合规条款）、召回率（降低漏检违规内容）、F1值（平衡精准率与召回率）；
效率指标：单文档审核延迟、单块文本处理耗时；
覆盖率指标：敏感词变体识别率、行业特规匹配率。评估方法采用“人工标注测试集+自动化对比”，确保模型效果达标。

总结

架构设计阶段的核心决策均围绕MCP+Agent架构的核心目标展开：AC自动机+AI双轨兼顾效率与覆盖率，语义切块规避token限制，多维度评估体系保障效果可控。这些决策既解决了传统微服务的耦合问题，又适配AI原生特性，最终实现“工具层标准化、逻辑层灵活化”的重构目标。

一图流

#AI求职实录#

全部评论

推荐最新楼层

在等offer的小飞象很理性

中国第一拖拖拉机集团有限公司拖拉机学院后端工程师

学到了催更

点赞回复分享

发布于 02-19 21:19 广东

03-19 13:18

郑州轻工业大学 Java

27届双非找暑期/日常实习

想知道简历还有没有需要修改的地方 之前是两页 现在浓缩成了一页

点赞评论收藏

分享

03-06 14:28

已编辑

门头沟学院测试开发

关于双非同学暑期测开实习需要如何准备?

大家好,我是小浪. 不知不觉又来到了新的一年暑期实习,3-5月份是27届同学找暑期实习的窗口,很多同学都在提前准备,亦或者是还不知道如何准备以及是否需要投递等,接下来,我将站在投递软测,测开岗位的角度聊一下,希望提的建议对你有所帮助.一.测试要学到什么程度可以投递暑期?在我之前发布的测开方向学习路线中,基本把校招需要用到的测试部分的学习内容都梳理了一遍,需要详细了解的同学可以点过链接看一下: https://www.nowcoder.com/share/jump/9563536771772522444290那么其实在这个链接之外的话还需要补充的技术栈需要根据你自身的情况来定,比如你之前走的是J...

点赞评论收藏

分享

03-09 13:27

门头沟学院人工智能

美团小美agent产品实习一面凉经

被横向挂了，希望发出来对大家有帮助！1.实习深挖2.解释vibecoding项目的背景？3.为什么大模型选豆包？4.拿到什么东西 前后端搭建的是怎么样的 产出是怎么样的？5.为什么不用deepseek？是多模态能力不太行吗？6.项目后续还继续做吗？跑出来一个mvp？7.和chatgpt讨论设计方案的时候 在哪里讨论？8.Cursor coding的时候用的是什么模型 auto？9.Vibe coding的过程中 有什么感悟 对于vibecoding 什么都可以说10.除了这个项目 有没有日常的小工具的开发？11.Cursor claudecode 不同的ide有什么看法 用下来有什么感觉？12.Skills呢？展开说说 有什么看法？13.日常有什么卡点 可以写一个skill？不需要写出来 有什么想法？

查看12道真题和解析

点赞评论收藏

分享

03-22 19:35

门头沟学院推荐算法

日常实习之推荐算法京东二面

感觉自己好菜、面试很难，还是要多多练习，感觉自己说不明白业务逻辑项目拷打1.生成式推荐和判别式推荐本质区别2.推荐算法发展脉络3.智力题:一个天平，101个玻璃球，找质量不同的那个需要秤几次

查看3道真题和解析

点赞评论收藏

分享

03-21 04:30

门头沟学院 Java

字节大模型应用开发二面日常实习

发点面经攒攒人品～1.实习介绍2.拷打第一个项目3.拷打第二个项目4.在向量化之前，为什么要对长文档进行切片？如果不切片会有什么后果？5.切片时设置重叠区域的作用是什么？这个比例你通常怎么来确定？6.讲一下稠密向量与稀疏向量的区别，分别适合处理什么样的搜索需求？7.向量库检索出的Top-K结果，如果K值设置得过大，对后续的生成质量有哪些负面影响？8.余弦相似度和欧氏距离在衡量文本相似性时，各自的优缺点是什么？9.为什么在初筛召回之后，还要加一个Rerank模型？它能解决向量搜索的哪些局限？10.如果文档发生了局部更新，如何通过增量索引来避免全量重新向量化？11.在RAG的生成阶段，如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉？12.了解HyDE吗？介绍一下原理，它在处理模糊提问时有哪些优势？13.随着超长上下文模型的出现，你认为传统RAG架构的必要性是否降低了？14.你了解哪些大模型推理框架？SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势？15.调用大模型API时，为什么要使用asyncio异步编程？它在处理高并发请求时有何优势？16.针对大规模PDF解析这种任务，你选择多线程还是多进程？17.如何确保Agent返回的结果是标准的JSON格式？如果模型输出中有多余的说明文字，你在后端如何提取？18.场景题：对于RAG，如果检索到了针对同一故障的两份手册，内容相互冲突，请你设计一套逻辑，让模型能够识别冲突并优先选择时效性更高的信息？19.手撕：第k大元素

查看19道真题和解析

点赞评论收藏

分享

评论

3

1

招聘动态

米哈游2026校园招聘

应届生春招&全年实习生专项

新华三

2026届春季校园招聘

联想

27届暑期实习

奥克斯集团

2026春季校园招聘

厦门银行

2026届春季校园招聘

联想

26届补录

携程集团

2026年春季校园招聘

AI网申助手

网申字段一键填写

27届校招宝典

滴滴

2026届春季校招

全站热榜

更多

拼多多笔试真简单..

热聊中

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

22153次浏览 368人参与

# 携程笔试 #

138136次浏览 829人参与

# 开放七大实习专项，百度暑期实习值得冲吗 #

16433次浏览 238人参与

# 拼多多集团-PDD笔试 #

34064次浏览 329人参与

# 找AI工作可以去哪些公司？ #

11802次浏览 445人参与

# 一人说一个提前实习的好处 #

118039次浏览 709人参与

# 厦门银行科技岗值不值得投 #

8630次浏览 192人参与

# 从事AI岗需要掌握哪些技术栈？ #

11253次浏览 528人参与

# 工作中，努力重要还是选择重要？ #

276089次浏览 2554人参与

# 你做过最难的笔试是哪家公司 #

39644次浏览 442人参与

# AI面会问哪些问题？ #

31246次浏览 765人参与

# 金三银四，你的春招进行到哪个阶段了？ #

23049次浏览 288人参与

# 中国电信笔试 #

32685次浏览 302人参与

# 哪些公司真双非友好？ #

70093次浏览 291人参与

# 投递几十家公司，到现在0offer，大家都一样吗 #

341838次浏览 2186人参与

# 秋招被挂春招仍然能投的公司 #

28721次浏览 232人参与

# 深信服求职进展汇总 #

262164次浏览 1816人参与

# bilibili求职进展汇总 #

187154次浏览 1086人参与

# 同bg的你秋招战况如何？ #

212331次浏览 1121人参与

# 如何准备秋招 #

78385次浏览 868人参与

# 校招谈薪一定要知道的事 #

39764次浏览 220人参与

# 应届生被毁约被毁意向了怎么办 #

63488次浏览 305人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务