2025-12-02 13:37 已编辑门头沟学院 golang 发布于北京

关注

PPIO - Serverless AI 后端 - 一面一小时

让 AI 梳理的录音，部分可能会不太准确

Q1: 百度这边推理优化用的什么框架,主要做了什么?

使用框架: SGLang

主要工作:

FP8量化: 显存降低50%,吞吐量提升40-50%,困惑度变化<2%
Chunked Prefill调优: 升级SGLang到0.5.4版本，默认开启chunked prefill, P999延迟从150ms降到120ms
CUDA Graph优化: 解决FP8量化模型无法启用Piecewise的问题,通过注册自定义kernel到FakeTensor。P999延迟降到53ms(降低55%),QPS从30提升到60
并发稳定性: 修复TokenizerManager高并发内存越界问题

Q2: GPU自动化测试怎么做的?

基于已下线rank模型改造,部署到容器中。发包机和目标服务通过信号传递协同控制,定时轮询容器状态,自动采集性能数据。

测试的是L4卡的模型推理性能,不涉及多卡通信。

Q3: 有测过多卡通信性能吗?

没有接触过。目前只做了单卡/单机的模型推理性能测试,没涉及多机多卡部署和卡间通信测试。

Q4: 有做输出质量的benchmark测试吗?

做得比较少。因为query模型是embedding模型,不是生成式模型,只需要保证和策略提供的 baseline 有 99.95% 以上相似度即可。

Q5: 这个Etcd安全漏洞怎么回事,怎么解决的?

问题: 被扫描发现Etcd可无密码访问

原因: Tarot Proxy配置传递流程不规范,认证配置没有正确传递，Etcd V2 V3 鉴权不统一，误导排查

解决: 重构RouteTable配置解析逻辑,规范化配置传递流程,省去中间链路

Q6: 没考虑用mTLS双向认证吗?

考虑过但没采用。主要原因:

TLS握手会增加延迟
证书管理运维成本高
内网环境已有网络隔离保障

Q7: 除了百度搜索这边还有什么对你帮助比较大的项目?

腾讯云实习: 提升了链路排查问题的能力

例: 门神项目流量统计不一致,通过时间窗口定位组件,发现网关配置max packet size导致2M+请求包绕过转发,造成防护绕过。

开源项目: Apache Seata和OSPP开源之夏,在分布式事务和系统设计方面有收获

Q8: 大包转发怎么做的,有考虑性能优化吗?

方案: 在网关入口部署MQ转移大包,再接入门神。单服务在SA2(4C8G)上达到2400+/分钟转发吞吐量。

性能优化: 主要在应用层做了消息队列削峰、异步处理等优化。

不足: 内核态用户态切换没有深入考虑过优化。

Q9: 开源之夏项目主要做了什么?

基于Seata Saga的AI Agent生态建设:

Agent Hub注册中心: 基于Seata NamingServer实现能力发现,结合LLM和Milvus向量数据库优化匹配
A2A通信协议: 支持JSON-RPC和gRPC,让Agent之间相互调用
智能工作流编排: 基于ReAct框架分析需求,通过多轮对话查询Agent能力,编排成JSON格式DAG图
DSL代码脚手架: 自动生成Agent Skill框架,采用Provider模式降低接入成本

Q10: 有调研自动生成补充agent能力的方案吗?

调研过两个方向:

DSL约束代码生成: 用DSL描述Agent行为约束,让大模型生成代码框架(已实现)
动态能力补充: 缺少能力时动态创建Agent(仅调研,未落地)，担心代码质量和安全性，调试维护成本高，目前倾向于预先注册能力而非动态生成

全部评论

推荐最新楼层

明天不下雨了

广东药科大学后端工程师

二面呢

快点

点赞回复分享

发布于 2025-12-04 16:35 广东

后端毁我一生

门头沟学院后端工程师

看不懂

点赞回复分享

发布于 2025-12-03 08:22 上海

换个角度想

厦门大学附属实验中学 Java

直接高级工程师吧，tql

点赞回复分享

发布于 2025-12-02 13:56 福建

明天不下雨了

广东药科大学后端工程师

你为何如此强

点赞回复分享

发布于 2025-12-02 13:31 广东

03-26 09:27

门头沟学院 Java

AI时代岗位活路全景图

刷到这个话题，发现很多同学对AI时代的岗位认知，还停留在“AI能写代码=程序员要失业”的表层焦虑里。作为在AI行业摸爬滚打了一年的开发，结合行业现状和招聘市场的真实需求，今天给大家做一份完整的「AI时代岗位活路全景图」，分6大类讲清楚：哪些岗位不仅不会被AI替代，还会在AI浪潮里迎来长期红利，核心壁垒是什么，入行需要什么能力，全是干货，没有一句废话。先给一个最核心的底层逻辑：AI能替代的，是标准化、重复性、低决策成本的执行类工作；永远替代不了的，是需要非标准化、深度思考、复杂决策、业务理解、人性洞察的工作。判断一个岗位有没有活路，就看它的核心价值，是执行，还是思考与决策。一、AI原生核心赛道：...

你觉得什么岗位会被AI替...

点赞评论收藏

分享

03-26 12:52

门头沟学院算法工程师

AI infra应届春招

📍面试公司：小米🕐面试时间：2026/03/26（二十分钟草草收场，都不想去看结果就知道挂了）💻面试岗位：大模型推理优化❓面试问题：一、自我介绍二、八股问题拷打，其实上来就是手撕1、直接在编辑器上手撕MGA，要求写出init、forward、注意力层   ——丢人现眼了，基本不会写2、追问，不会写的话讲一下整个过程，输入到输出怎么样的？         ——讲了讲transformer，注意力机制3、vllm和sglang的底层代码有看过吗？                                          ——没看过（其实看过，但我不敢说，怕叫我写）4、kv cache有哪些加载方式？                                                        ——在胡言乱语，啊这个，啊那个5、PD分离机制是干什么的？你怎么实现的？                                   ——唯一能回答的问题6、有没有用vllm部署过模型？吞吐量是多少？                                 ——脑子昏了，沉默（跑了demo，没测过）7、MTP（可能是MCP？没听清）是什么，介绍一下？                     ——我估计想问Medusa？反正我没回答，沉默。到这他问不下去了。。。三、反问两个人尴尬一笑，没什么要问的了。🙌面试感想：应该是史上最无悬念的秒挂，第一个手撕不会之后我已经晕头转向了，加上昨天熬夜到五点，到后面我都有点不好意思了，感觉在浪费他的时间，在这里跟他道个歉😀。十月到现在算上开发+infra可能面了二十多家吧，大部分都是秒挂，感觉车企infra这块的要求都特别高吧，问的特别细，就是最新的技术一定都要掌握，这一块技术迭代感觉特别特别快，光背八股面经给我感觉不太行。鼠鼠也累了，但自觉已经尽力了。也感谢这些至少还给机会面试的公司吧，有些简历直接投垃圾桶里了。（希望下一届的同学早早准备，不要像鼠鼠一样还在为春招奔波）。

查看8道真题和解析

点赞评论收藏

分享

04-23 12:03

已编辑

南京航空航天大学算法工程师

26届春招寒武纪 AIGC推理框架研发工程师

2025.4.16，感谢信2025.4.13，二面，20minC++函数模板、规避内存泄露的方法torch compiler、cuda graph是否了解 ptx2026.3.25，一面，1h推理框架研发工程师岗位的理解降低大模型推理成本手段为什么要做算子融合cuda graph 原理、作用、使用场景3D 并行 & EP & CP & SP 原理、作用模型量化类型、原理、作用介绍MTPvllm的整体架构，请求在内部是如何流转的kvcache的空间如何计算prefix cache介绍vllm V0/V1 比较TP下，不同的模块如何汇总结果口述multi head atte...

查看19道真题和解析

点赞评论收藏

分享

04-14 22:38

东北大学 C++

快手ai infra二面

问简历 cutlass2.0 怎么实现grouped gemmfa3和fa4区别blackwell和hopper比有什么变化hang都有可能因为什么，分别要如何排查CUDA_DEVICE_MAX_CONNECTIONS能干什么，和launch bound什么关系寄

查看5道真题和解析

点赞评论收藏

分享

04-18 12:48

香港中文大学（深圳）人工智能

【暑期实习】华为 AI 工程师一面复盘

项目深挖很多，最后还有一道“手写”代码题这场华为 AI 工程师暑期实习的面试，整体节奏比较完整，基本就是“自我介绍—项目深挖—反问—代码题”这一套。刚开始先让我共享桌面，结合简历做自我介绍，讲自己的学习背景、做过的项目，以及现在的方向。前面这部分我还是按自己的主线来讲：山大本科电子和计算机双修，港中深硕士，方向慢慢转到 AI Infra、异构计算和性能优化；实习这边讲了之前做过的通用软件工程工作，以及现在做的算子优化和图优化相关内容。面试官前面没有特别打断，但后面几乎每一段都会继续往下追。项目里问得最多的，一个是我自己做的量化推理 runtime，另一个是现在在做的算子/图优化相关工作。量化项...

查看18道真题和解析

点赞评论收藏

分享

评论

2

5

招聘动态

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

AI网申助手

网申字段一键填写

阿里巴巴集团

2027届实习生校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如果春招能重来，我会___ #

3460次浏览 33人参与

# 想做Agent可以做哪些岗位？ #

1557次浏览 20人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

42146次浏览 494人参与

# 这个offer值得去吗？ #

1351次浏览 19人参与

# 面试官拷打AI项目都会问什么？ #

1280次浏览 57人参与

# 除了线上，还能去哪些地方投简历 #

2516次浏览 29人参与

# 你觉得最好用的AI编程工具是_ #

658次浏览 21人参与

# mt对你说过最有启发的一句话 #

114992次浏览 869人参与

# 你会因为行情，降低找工作标准吗？ #

5965次浏览 72人参与

# 如何排解工作中的焦虑 #

323564次浏览 2778人参与

# 工作两年想退休了 #

272108次浏览 2057人参与

# 银行笔面经互助 #

195634次浏览 1323人参与

# 双非本科的出路是什么？ #

230604次浏览 1657人参与

# 你的第一家实习公司是什么档次？ #

73238次浏览 342人参与

# 你和你的mentor相处模式是__ #

5141次浏览 40人参与

# 你的mentor是什么样的人？ #

61472次浏览 794人参与

# 科大讯飞求职进展汇总 #

384135次浏览 3069人参与

# 实习第一天，你在干什么 #

3138次浏览 21人参与

# 哪些公司在招寒假实习？ #

95331次浏览 768人参与

# 秋招投递记录 #

416896次浏览 3281人参与

# 如果公司降薪，你会跳槽吗？ #

160739次浏览 950人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务