首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
Simon-
02-12 10:49
已编辑
腾讯_C++
发布于河南
关注
已关注
取消关注
腾讯混元 AI Infra 招一个多模态生成推理加速方向的实习生
要求熟悉 vllm 框架&常见的LLM模型 DiT 模型的加速方法
base北京,能转正,26 年毕业的优先!
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
03-18 14:10
牛客运营
1天介绍1个项目|CoPaw AI助手
今天给大家介绍一个非常适合上手实操的 AI Agent 开源项目——CoPaw(GitHub 12.5k star),一个真正能跑起来、用起来的私人 AI 助手。 CoPaw 是什么? CoPaw 全称 Co Personal Agent Workstation,是一个可以部署在自己电脑或云端的个人 AI 助手框架。它不是那种只能在网页聊天的 demo,而是能接入你日常使用的各种聊天工具,帮你干活的实战型 Agent。 一句话总结: 把 AI 能力接入你的钉钉/飞书/QQ/Discord/Telegram,让它变成你的 7x24 小时私人助理。 为什么推荐这个项目? 1. 上手极简,3 行命令...
AI求职实录
点赞
评论
收藏
分享
02-22 21:56
中山大学 算法工程师
大厂大模型算法岗推理类面试题总结
1️⃣大模型推理优化方面KV Cache 、PagedAttention 、FlashAttention 等技术,提升吞吐和显存利用率。2️⃣高频考点vLLM 与 PagedAttentionKV Cache 原理与优化推理加速综合策略3️⃣公司考察侧重点差异💞字节跳动:全面覆盖推理优化、推荐系统、多模态等多个方向,考察系统化思维能力👀腾讯:偏重推理框架( vLLM 、FlashAttention )和长上下文优化🍎美团/滴滴:关注实用化推理加速技术选型和实践经验4️⃣面试准备建议➡➡掌握核心原理:深入理解 vLLM 的PagedAttention 、 KV Cache 、 FlashAttention 核心技术的实现机制。➡➡积累实战经验:准备具体的优化案例,包括量化效果、延迟提升数据等量化指标。➡➡构建系统视角:不仅要懂算法原理,还要了解系统资源调度、并发处理等工程实践。⭕如果你现在:- 春招/秋招没方向- 简历没人看- 面试总挂- 不知道怎么准备📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看5道真题和解析
点赞
评论
收藏
分享
03-17 15:47
门头沟学院 C++
影石 音视频开发- C++ 一面
1. 自我介绍2. 说一下 new 和 malloc 的底层实现原理答案:malloc 是 C 里的内存分配函数,本质上就是向运行时分配器申请一块指定大小的原始内存,返回的是 void*,它只负责分配内存,不会调用构造函数。底层分配器一般会维护空闲链表、内存池之类的数据结构,再通过 brk 或 mmap 向操作系统要内存。new 是 C++ 的运算符,它通常分两步:先调用 operator new 分配原始内存,再在这块内存上调用构造函数完成对象初始化。如果构造函数抛异常,C++ 还会负责把前面申请到的内存回收。所以严格来说,new 和 malloc 最大的区别不是“一个是运算符一个是函数”这...
C++ 常考面试题总结
点赞
评论
收藏
分享
02-28 08:30
门头沟学院 机器学习
字节AI算法 二面 好难啊
发点面经攒攒人品1、你在线上或离线训练时,过拟合怎么处理?直接说你最有效的三个方法和拿到的收益。2、把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同;跟 LN、GN 比,分别什么时候用、怎么取舍。3、分类和回归你最常用哪些损失?你更偏好哪几个,为什么(从鲁棒性、梯度、数值稳定性上谈)。4、L1 和 L2 正则你怎么选?它们各自的效果与风险是什么,工程里你是怎么权衡的。5、二元和多分类的交叉熵你怎么写?在工程里你怎么做数值稳定实现。6、AUC 到底在统计上代表什么?你怎么计算它,在线上业务里你如何解释“这次 AUC 提升”的含义。7、你做 CTR/CVR/CTCVR 联合建模时,ESMM/ESMM2 是怎么推导与工程落地的?线上到底带来了什么收益。8、Transformer 里因果注意力的 Q/K/V 各从哪来?Mask 具体怎么实现。9、Scaled Dot‑Product Attention 为啥要除以 √dk?如果不除会出什么数值或训练问题。10、把 Transformer / Decoder‑only 的整体结构过一遍,各个组件分别在干什么,有哪些常见变体。11、位置编码这条线你怎么选:绝对 PE、相对 PE、RoPE 各自的思路、优势和局限,结合你的项目谈取舍。12、长上下文怎么搞?Rope scaling、Position Interpolation、KV Cache 管理、检索增强、窗口注意力,你的实战方案是什么。13、KV Cache 在训练和推理中的差异是什么?它的加速价值有多大,吞吐与延迟你是如何权衡的,vLLM/paged‑attention 需要注意什么。14、PEFT 方案里(LoRA/QLoRA/Prefix/Prompt‑Tuning/Adapter)你怎么选?说说稳定训练的经验。15、SFT 和对齐(RLHF/DPO/IPO/PPO)原理差在哪?在不同数据与资源条件下,你怎么选路线。16、RAG 系统你怎么设计?切分、索引、召回/重排、压缩/融合、兜底策略怎么串。17、提示词工程你是怎么搞的?System/角色/约束/分步指令怎么写,如何防越狱
查看17道真题和解析
点赞
评论
收藏
分享
03-05 14:43
快手_研发管理办公室_前端开发(实习员工)
3.3春招字节音视频前端一面
自我介绍 用了哪些方法使FCP渲染耗时缩短近1s 有没有遇到过哪个包不支持ESM的,你是怎么处理的 你进行代码分割的思路是什么 不定高的虚拟列表的实现原理是什么NextJS有哪些渲染模式,分别介绍一下你们的应用用的是哪种 NextJS中有一个内置的图片优化组件,它做了哪些优化 让你优化图片显示你怎么优化webp格式的图片有兼容性问题吗,怎么做降级处理 AI问答应用有出现页面抖动的情况吗,你是怎么处理的应用用的什么markdown库 AI问答应用有出现返回中断导致的markdown显示错误吗,是怎么处理的浏览器插件有哪些组成部分各个部分怎么进行通信插件的sidePanelAI应用的思考模式是怎么...
点赞
评论
收藏
分享
一键发评
vllm用的啥版本
接好运
耐面王
base北京能租房补贴吗
26届还有hc吗
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
我们为什么要做网申助手这个插件
9584
2
...
找实习两个月,工具用了一堆,最后只留下这些
4994
3
...
速收藏!各公司最新招聘进展!
3974
4
...
面试官视角聊聊:如何通过AI coding面试?附焚决
2955
5
...
腾讯前端一面,没想到问这些
2462
6
...
小红书暑期一面
1993
7
...
字节暑期实习OC
1721
8
...
携程暑期一面凉经
1418
9
...
2027届bilibili前端开发实习生
1315
10
...
字节后端二面,比一面难多了
1214
创作者周榜
更多
正在热议
更多
#
跟HR说什么能被秒回?
#
13349次浏览
226人参与
#
腾讯音乐求职进展汇总
#
159515次浏览
1093人参与
#
巨人网络春招
#
10785次浏览
164人参与
#
你收到了哪些公司的笔试?
#
26737次浏览
142人参与
#
小红书求职进展汇总
#
225786次浏览
1344人参与
#
春招/暑实第一面是哪家?
#
27576次浏览
274人参与
#
MiniMax求职进展汇总
#
20111次浏览
268人参与
#
网易游戏笔试
#
5830次浏览
78人参与
#
把自己当AI,现在最消耗你token的问题是什么?
#
5412次浏览
131人参与
#
职能管理面试记录
#
10202次浏览
56人参与
#
工作中遇到的歹人
#
96175次浏览
535人参与
#
校招笔试
#
458675次浏览
2935人参与
#
如果重来一次你还会读研吗
#
228667次浏览
2008人参与
#
如何一边实习一边找下家?
#
38432次浏览
309人参与
#
网易笔试
#
151251次浏览
789人参与
#
正在春招的你,也参与了去年秋招吗?
#
361211次浏览
2623人参与
#
面试官最爱问的 AI 问题是......
#
23466次浏览
735人参与
#
现在入门AI应该走哪些方向?
#
7131次浏览
131人参与
#
你怎么看待AI面试
#
177927次浏览
1040人参与
#
我的AI电子员工
#
33951次浏览
222人参与
#
AI时代,哪些岗位最容易被淘汰
#
59950次浏览
595人参与
#
你的嫡系AI是哪个?
#
6404次浏览
143人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务