求问AI Infra实习

    bg双c2计科,目前研0,一段后端实习,被部门的ai氛围熏陶的很厉害,知道自己没有科研天赋,想转ai infra,目前对推理优化方向的了解的多一些,对训练加速也比较感兴趣,但是现在感觉就是理论知识塞了很多,实操顶多debug一下vllm、sglang,写一点很简单的cuda,代码看的也似懂非懂。导师大概率放任何没课时间的实习,想要请教下牛友经验,怎样高效准备能找到寒假的日常实习
#AI Infra# #日常实习# #研究生#
全部评论
珍贵李👴,dubbo之父,微软实习,贡献11万行代码
2 回复 分享
发布于 昨天 17:43 浙江
珍贵
2 回复 分享
发布于 昨天 17:32 浙江
牛逼的啊
1 回复 分享
发布于 昨天 21:02 浙江
珍贵烧帅
1 回复 分享
发布于 昨天 18:19 北京

相关推荐

昨天 18:21
已编辑
四平职业大学 Java
经典后端网络八股, 但是答的不好。经典点菜问题手撕, 我写的是回溯O(n^3), 但我把时间复杂度说成2^n 了。 面试官让我回去想想还有没有更优解。仔细想了下, 我写的应该是最优解。这次是HR约面的,官网上都没有记录。【面试问题】🔍 请简单介绍一下你自己。🔍 为什么选择手动硬编码 workflow,而没有使用大模型做动态调度?🔍 你在项目中使用 C 与 go 进行跨进程通信,为什么采用消息队列而不是直接的跨语言调用(FFI)?🔍 IPC(跨进程通信)具体指什么?有哪些实现方式?🔍 你们跨进程传输数据时采用了 message pack 序列化,如果数据包很大,有没有其他避免序列化开销的方案?面试官对这个问题非常在意, 多次问到这个。🔍 你提到共享内存,请解释一下共享内存在 Linux 中的底层实现机制。🔍 如果有一个大文件每次启动都要解析加载,耗时很长,有没有办法将其直接打包成内存镜像,部署时直接加载?面试官对这个问题非常在意, 多次问到这个。🔍 对于 protobuf 这类已经很紧凑的二进制数据,还能如何进一步优化加载速度?🔍 你熟悉 go 的哪些特性?简单描述一下 go 的垃圾回收机制。🔍 请解释一下 JWT 双 token 认证的实现细节:如何签名、如何验签、token 存储位置以及安全性问题。🔍 JWT 第一次请求时没有 token 怎么办?🔍 JWT 可以放在请求 body 或 query 中吗?为什么不推荐这样做?🔍 HTTPS 与 HTTP 在传输安全性上有什么区别?🔍 你使用过哪些数据库?简单描述一下 PostgreSQL 与 MySQL 的区别。🔍 C++ 标准库中有 map 吗?🔍 C++ 没有垃圾回收,如何通过智能指针实现类似自动内存管理?🔍 请详细解释 C++ 中智能指针(unique_ptr、shared_ptr)的实现机制,引用计数如何工作?🔍 智能指针的析构过程是在编译时还是运行时完成?感觉的出来面试官对cpp不怎么了解。🔍 如果 go 调用 C++,数据量很大且不想序列化,有什么优化手段?面试官对这个问题非常在意, 多次问到这个。🔍 实现一个函数:给定菜品列表,每人点 3 道菜,单个价格不超过 105 ,总价格不超过 250 元,输出所有可能的点菜组合。估计是G了,期待再被捞起吧。随缘吧。
投递字节跳动等公司10个岗位
点赞 评论 收藏
分享
今天 02:14
已编辑
门头沟学院 后端
8.12 一面 当场过8.15 二面周五周六8.18 周一上午 口头oc8.19 offer 邮件以下为面经:8.12一面:聊天 5 min问项目 35 min简历是 12306 + 一个自己搓的 ai 应用项目主要问的问题:12306:1.为什么用责任链模式,有哪些好处, 项目中有没有其他的设计模式?2.mysql 有那些索引?你觉得 innodb 索引为什么用 b+树 而不是红黑树,其他的引擎的索引有了解吗? 举一个你项目中遇到的使用组合索引的例子,为什么选择这些字段?建立索引的时候选取字段有哪些要注意的?3.消息幂等组件库怎么做的? 为什么用消息队列? 除了 rocketmq 其他的有了解吗 ? 现在有这么一个场景,你刚才讲的本地消息表的 消息 是存在 redis 的, 如果突发流量打垮服务器怎么办,说一个你认为的优化方案?ai 项目:1.为什么做这个项目?你考虑的点在哪里?对自己使用的技术怎么样去了解的,比如向量数据库等(这里自己提的)2.RAG 流程3.embedding 之前的向量化怎么做的有没有了解?项目里面openai 的这个模型的向量化怎么做的(后面这个自己补充的)八股: jvm 的逻辑分区了解过吗?经历过怎么样的变化?g1 和 cms 的区别 ? 堆区详细的划分知道吗?手撕: 二叉树层序遍历 10 min最后直接和我说过了,让我等二面或者直接入职(问 leader 有无二面)8.15二面:35 min (无手撕)12306 : 1.雪花算法技术原理,整体优势,解决了什么问题,比如数据库取 id 的哪些问题,展开讲。2.美团的 leaf 原理,为什么做双 buffer,什么好处 ?(这里自己提了一嘴)3. 布隆过滤器原理,问还有什么过滤器,答 计数布隆过滤器 和 布谷鸟过滤器(这里讲的比较久,所以没问 12306 了)ai 项目: 1.知识库检索原理(rag 流程),检索返回设置 topk  ,向量检索相似性算法2. langchain 框架的架构、整体设计是什么样的?3. mcp 是什么? 原理,组件 host client server4.  开发过 mcp server 吗,开发的 mcp server是用来做什么的 , 三种传输方式 stdio ,streamable  http , sse 了解过吗5. 为什么对 qwen2.5 做模型微调,怎么考虑的,语料怎么选择的,gpu 显卡的情况.反问:1.做什么业务2.作为面试官更看重求职者的那些特点,(说是知识扎实 和 对于新技术的快速掌握)8.18  隔了周末之后周一上午 口头 oc8.19  邮件 offer总结:强度一般,问题中规中矩。
我的OC时间线
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务