昨天 13:37 已编辑百度_搜索架构实习生(实习员工)

发布于北京

关注

PPIO - Serverless AI 后端 - 一面一小时

让 AI 梳理的录音，部分可能会不太准确

Q1: 百度这边推理优化用的什么框架,主要做了什么?

使用框架: SGLang

主要工作:

FP8量化: 显存降低50%,吞吐量提升40-50%,困惑度变化<2%
Chunked Prefill调优: 升级SGLang到0.5.4版本，默认开启chunked prefill, P999延迟从150ms降到120ms
CUDA Graph优化: 解决FP8量化模型无法启用Piecewise的问题,通过注册自定义kernel到FakeTensor。P999延迟降到53ms(降低55%),QPS从30提升到60
并发稳定性: 修复TokenizerManager高并发内存越界问题

Q2: GPU自动化测试怎么做的?

基于已下线rank模型改造,部署到容器中。发包机和目标服务通过信号传递协同控制,定时轮询容器状态,自动采集性能数据。

测试的是L4卡的模型推理性能,不涉及多卡通信。

Q3: 有测过多卡通信性能吗?

没有接触过。目前只做了单卡/单机的模型推理性能测试,没涉及多机多卡部署和卡间通信测试。

Q4: 有做输出质量的benchmark测试吗?

做得比较少。因为query模型是embedding模型,不是生成式模型,只需要保证和策略提供的 baseline 有 99.95% 以上相似度即可。

Q5: 这个Etcd安全漏洞怎么回事,怎么解决的?

问题: 被扫描发现Etcd可无密码访问

原因: Tarot Proxy配置传递流程不规范,认证配置没有正确传递，Etcd V2 V3 鉴权不统一，误导排查

解决: 重构RouteTable配置解析逻辑,规范化配置传递流程,省去中间链路

Q6: 没考虑用mTLS双向认证吗?

考虑过但没采用。主要原因:

TLS握手会增加延迟
证书管理运维成本高
内网环境已有网络隔离保障

Q7: 除了百度搜索这边还有什么对你帮助比较大的项目?

腾讯云实习: 提升了链路排查问题的能力

例: 门神项目流量统计不一致,通过时间窗口定位组件,发现网关配置max packet size导致2M+请求包绕过转发,造成防护绕过。

开源项目: Apache Seata和OSPP开源之夏,在分布式事务和系统设计方面有收获

Q8: 大包转发怎么做的,有考虑性能优化吗?

方案: 在网关入口部署MQ转移大包,再接入门神。单服务在SA2(4C8G)上达到2400+/分钟转发吞吐量。

性能优化: 主要在应用层做了消息队列削峰、异步处理等优化。

不足: 内核态用户态切换没有深入考虑过优化。

Q9: 开源之夏项目主要做了什么?

基于Seata Saga的AI Agent生态建设:

Agent Hub注册中心: 基于Seata NamingServer实现能力发现,结合LLM和Milvus向量数据库优化匹配
A2A通信协议: 支持JSON-RPC和gRPC,让Agent之间相互调用
智能工作流编排: 基于ReAct框架分析需求,通过多轮对话查询Agent能力,编排成JSON格式DAG图
DSL代码脚手架: 自动生成Agent Skill框架,采用Provider模式降低接入成本

Q10: 有调研自动生成补充agent能力的方案吗?

调研过两个方向:

DSL约束代码生成: 用DSL描述Agent行为约束,让大模型生成代码框架(已实现)
动态能力补充: 缺少能力时动态创建Agent(仅调研,未落地)，担心代码质量和安全性，调试维护成本高，目前倾向于预先注册能力而非动态生成

全部评论

推荐最新楼层

换个角度想

厦门大学附属实验中学 Java

直接高级工程师吧，tql

点赞回复分享

发布于昨天 13:56 福建

明天不下雨了

广东药科大学后端工程师

你为何如此强

点赞回复分享

发布于昨天 13:31 广东

12-01 16:46

门头沟学院 Java

快手电商后端

25.5k*16，一直说我面评很好，然后就开了个大白菜，电商的强度性价比太低了，前前后后四轮面试，真的够了

校招薪资来揭秘

点赞评论收藏

分享

昨天 13:17

已编辑

门头沟学院 Java

最烦强制参加活动

强制参加活动最烦，比如那种遇到春节、中秋、元旦啥的就上演的公司晚会：领导致辞、员工才艺表演、抽奖环节、集体合影……表面其乐融融，实则劳民伤民，好麻烦。在我看来，少整这些虚头巴脑的，多发发钱或者提高提高待遇比啥都去。1. 美其名曰庆祝，实为任务你以为这是放松？不，这是新KPI。节目要排练、主持要写稿、道具要采购、座位要安排……本该享受假期的前一周，大家却在加班搞彩排。唱歌跑调也要硬上，跳舞僵硬也得凑数，真是折磨I人呢。这不是福利，这是义务劳动。。。2. 形式僵化，看着就烦千篇一律的流程：开场舞→领导讲话→三句半→抽奖→大合唱《明天会更好》。内容陈旧、笑点尴尬、节奏拖沓。年轻人刷手机，老员工打瞌睡...

公司福利里最没用的一项是...

点赞评论收藏

分享

昨天 21:59

上海大学 Java

点赞评论收藏

分享

12-01 15:01

已编辑

门头沟学院 Java

实习+秋招 17轮面试鹅厂还是缺点缘分

其实倒也不是因为面试面不过，就是各种奇奇怪怪的问题一直推不到最后发offer从去年的冬天开始的面试，按时间顺序来梳理一下：1. WXG（公众号&小程序，后台开发，二面完终止），日常实习，考虑到入职时间、地点，二面后觉得我没法实习太久遂终止流程，说以后有机会还可以再联系他2. WXG（基础微信团队，客户端开发，三面完终止），日常实习，最终因为有了其他的offer，还是想去后端开发，遂拒掉后续的流程3. WXG（微信读书&输入法，后台开发，录用评估挂），暑期实习，面了一个月，技术面、面委、HR面都过了，到了录用评估然后挂了4. WXG（企业微信，后台开发，一面挂），暑期实习，被录用评估挂了之后状态很不好，没好好面5. PCG（大数据平台，后台开发，直接拒），暑期实习，已经拿到了暑期实习offer，所以直接拒了6. TEG（云架构平台，后台开发，一面挂），秋招，聊了一半发现根本聊不到一块，互相体面面完后不久就挂了7. WXG（微信支付，后台开发，录用评估一直不发offer），秋招，9月初面完所有面试，且招聘经理说都过了等通知，结果12月了还没正式offer，也没有人再联系我，直接拒掉倒也没感觉面试体验有多不好，就是总是奇奇怪怪的进不去哈哈，可能缺点缘分

你被哪些公司挂了？

点赞评论收藏

分享

昨天 12:20

华南理工大学算法工程师

懂车帝算法日常实习一面

实习部分： 1.介绍一下你的遗传算法具体是怎么做的？2.有没有出现不同时间参数效果不一致的情况？3.你负责哪一块工作？新闻推荐项目：1.介绍一下ItemCF的主要思想2.ItemCF有哪些改进思路3.介绍一下Word2Vec怎么做的4.为什么选择CBOW和skip-gram有什么区别吗，你为什么选择skip-gram5.DIN特征具体是怎么做的6. MMoE具体是怎么做的，有考虑过预测多目标互相干扰的问题吗？7.介绍一个其它的工业界用的多目标预测模型8.介绍一下工业界常用的精排和召回模型9.大模型与推荐结合的最新成果介绍一下？10. XGBoost还有GBDT的相关的介绍一下代码手撕：1.最长有效括号（用了栈，但是要求改进不用栈，但我不会2.在排序数组中查找元素的第一个和最后一个位置

查看15道真题和解析

点赞评论收藏

分享

评论

1

2

招聘动态

成方金融科技有限公司

全站热榜

更多

华为开奖交流

热聊中

创作者周榜

更多

正在热议

更多

# 十二月请对我好一点 #

8640次浏览 157人参与

# 父母对你找工作是助力还是阻力？ #

3188次浏览 70人参与

# 为了去实习，我赌上了___ #

3085次浏览 41人参与

# 聊聊我眼中的AI #

486083次浏览 6733人参与

# 工作中出现了XX情况正常吗 #

10080次浏览 116人参与

# 哪一瞬间让你觉得“这班不如不上” #

2345次浏览 23人参与

# 一人推荐一个值得做的项目 #

3300次浏览 52人参与

# uu们，春招你还来吗？ #

2302次浏览 25人参与

# 高薪高压 vs 低薪wlb，你怎么选？ #

3936次浏览 42人参与

# 回顾今年你干过的最“勇”的一件事 #

4935次浏览 73人参与

# 工作前VS工作后，你的心态变化 #

4210次浏览 34人参与

# 秋招有哪些公司要求提前实习 #

91218次浏览 488人参与

# 公司福利里最没用的一项是啥 #

2698次浏览 56人参与

# 机械人的金三校招总结 #

39004次浏览 465人参与

# 如何用一句话描述你的职业 #

28089次浏览 181人参与

# 追觅科技求职进展汇总 #

29015次浏览 181人参与

# 职场上哪些事情令人讨厌 #

32504次浏览 143人参与

# 机械人的薪资开到多少，才适合去？ #

150962次浏览 530人参与

# 你收到了团子的OC了吗 #

1469657次浏览 11805人参与

# 毕业季，给职场新人一些建议 #

162184次浏览 2367人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务