MiniMax 开源模型推理优化实习生一面凉经

一面,面试官水平很高,气质上给我的感觉像是清华或者中科大少年班的。面试体验很好。
首先聊了聊无经验为什么做AI Sys,答有传统计算机系统的学习经验,AI Sys很多思想和传统sys相同。举例Paged Attention和操作系统中虚拟内存分页的相似性。接下来问了问大模型推理的过程,有哪些潜在的优化点。接下来做题,一道没刷过的dp,虽然一眼看出是dp,但转移方程还是在面试官的提示下才设计出来的,最后corner case没处理好,没撕出来。技术不行,沉淀再战。#牛客AI配图神器# #聊聊我眼中的AI# #面试体验感最好的是哪家?#
全部评论
请问你投的是什么岗位呀
点赞 回复 分享
发布于 07-06 18:12 浙江
哈哈,这个帖子被面试官翻牌子了
点赞 回复 分享
发布于 06-02 18:24 北京
唉,这个面试官真的很厉害,动态规划的解题思路(分解问题,寻找重叠子问题,处理base case)和我平时的思考方式完全一样,只可惜当时太紧张了,还得多练
点赞 回复 分享
发布于 05-11 16:42 安徽

相关推荐

1. 项目背景:针对端侧设备(树莓派、昇腾、RK系列)的低资源环境,设计一套轻量化分布式框架,实现大模型(LLM/ASR/TTS等)的高效协同推理,解决端侧设备算力分散、通信受限、动态扩展难等问题。技术栈:Linux、C++、ZMQ、设计模式、分布式架构、主从Reactor模式、docker、cmake、shell3. 项目设计方案1. 双模式部署设计:设计Docker与裸机双部署方案,通过自动化镜像部署和容器操作脚本,环境部署效率提升70%2. 底层混合通信组件:- 设计基于ZMQ的多模式通信中间件,通过工厂模式统一创建PUB/SUB、PUSH/PULL、RPC等6种通信策略,结合策略模式实现动态通信方式切换,降低业务层网络代码复杂度70%;- 构建高可用RPC框架,支持方法动态注册与服务发现,通过设置双端超时控制与自动重连机制提高通信可靠性;- 设计ZMQ消息封装模块,开发轻量级序列化协议,采用长度前缀+紧凑存储结构设计实现多参数打包/解包3. channel模块设计:- 统一管理底层多模式通信中间件的ZMQ连接,支持动态URL绑定,信道注册- 设计观察者模式和闭包方案,实现网络层与业务逻辑的解耦- 通过动态work_id路由和连接池技术,实现多unit单元通信隔离- JSON协议设计,用于节点间/外部用户消息交互4. 分布式任务调度框架设计-与业务节点关系(继承)- 采用 Reactor模式,设计异步事件驱动的任务调度框架,通过eventpp实现毫秒级事件响应- 动态RPC服务注册,支持跨业务节点 setup/exit 等指令的远程调用- 统一管理 work_id-channel 连接池,对上层业务节点屏蔽底层通信复杂性- 提供标准化setup等虚函数接口,支持业务节点自定义任务处理逻辑5. unit-manager模块- 设计RPC服务注册,实现信道自动注册/释放,SQL处理;并解析 action 实现动态分发请求- 实现轻量化内存kv缓存数据库 存储 unit 元信息;并提供线程安全SQL查询接口,供节点动态通信- 设计多协议网关,实现TCP/ZMQ协议转换,支持外部用户-内部业务节点通信交互- 设计主从多Reactor TCP通信框架,实现压测10000+TCP并发连接6. Node业务层接口设计- TASK任务管理:实现单任务实例管理,模型加载/推理/流式输出回调机制等- 服务层控制:自定义实现setup等接口,对业务节点进行生命周期管理,实现节点间相互订阅
简历中的项目经历要怎么写
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务