大模型暑期实习面经|腾讯音乐娱乐集团 技术研究—自然语言处理

  • 部门:QQ音乐
  • base地:深圳
  • 流程:一面+二面+三面+HR面
  • 推进速度:非常快,每一面在一小时内出结果

一面 50min

  1. 自我介绍
  2. 论文介绍
  3. 什么是MHA
  4. Attention运算公式
  5. 为什么除以根号dk
  6. 介绍现有相对位置编码和绝对位置编码的异同点,都有哪些结构
  7. RoPE的结构
  8. RoPE相比于绝对位置编码的优势是什么?为什么外推性更好?
  9. 为什么RoPE理论上可以无限外推?
  10. RoPE为什么可以利用绝对位置和相对位置的优势?
  11. 介绍RAG项目(基座模型是什么?几b ?全参微调用了多少卡?数据多大?问答对的形式有图片吗?
  12. 对RAG的理解是什么?为什么要用RAG?
  13. BGE模型的结构
  14. 什么是LoRA?有个两层神经网络,参数1万*一万,低秩r =100, LoRA参数量是多少?
  15. 为什么用KV Cache?
  16. KV Cache有哪些优化方法?
  17. 文生图/图生文结构了解吗?文生图的怎么解码的
  18. CLIP了解吗?
  19. Deepseek MOE架构路由机制的细节
  20. 场景题
  21. 手撕:快速排序
  22. 反问

二面 60min

  1. 自我介绍
  2. 论文拷打,提出质疑
  3. RAG项目介绍
  4. 分块的策略是什么
  5. PDF的表格和图片怎么解析的?图片和表格的信息丢失了怎么办?
  6. RAG的关键词检索和重排细节
  7. 异构图方式和传统的多模态拼接方式有什么性能上的改进吗?
  8. 多模态之间的特征的对齐你是怎么做的?现有工作怎么做的
  9. Prompt有什么系统性优化的方法?
  10. 代码:199: 二叉树右视图
  11. 简单介绍一下Prefix Cache ? Deepseek 是怎么开启Prefix Cache的?
  12. 位置编码的作用的实现方式有哪些?
  13. LLM推理部署的时候,会用vLLM, 这主要从哪些方面提升?怎么提升的推理速度?
  14. 文本生成解码策略,贪心搜索和束搜索的优劣是什么?
  15. 实习时间,反问

三面 50min

  1. 自我介绍
  2. 论文拷打,细到实验结果数据
  3. RAG项目400万文字怎么分块,索引,embedding的
  4. 微调的指标和RAG的指标是什么?ROUGE指标怎么计算
  5. 评估方式是不是太简单了,对SFT的指标还有没有更好的
  6. 项目中负责的部分
  7. 用的最多的GPU时间是多少
  8. 有做过多机多卡训练吗
  9. 为什么去前端实习了后又转算法
  10. 对未来的规划是什么,想做什么技术
  11. 实验室的方向是什么
  12. 大模型的预训练和SFT的不同是什么
  13. 限制大模型输入长度的因素有哪些?
  14. 目前的大模型如何解决长上下文?

HR面 30min

主要问项目、规划等,氛围比较轻松

#大模型算法工程师##NLP##大模型##腾讯音乐26届实习#
全部评论
确实厉害,膜拜一下大佬。(许愿三面过)
2 回复 分享
发布于 04-23 00:24 陕西
请问大佬这个岗位都有三面吗,官网流程好像只显示二面+HR面
点赞 回复 分享
发布于 05-25 16:48 广东
佬了解过是哪个业务线吗,做的什么方向,我目前手上有个集团公线的自然语言处理,在考虑要不要去,不清楚跟 QQ 音乐业务线的差距。
点赞 回复 分享
发布于 05-13 00:41 北京
大佬投了多久约面的
点赞 回复 分享
发布于 04-26 23:20 四川
八股这么难么
点赞 回复 分享
发布于 04-26 07:01 四川

相关推荐

1. display: none 和 visibility: hidden 的区别• 渲染层面:◦ display: none:元素完全从渲染树移除,不占据空间(回流+重绘)。◦ visibility: hidden:元素仍在渲染树中,占据空间但不可见(仅重绘)。• 子元素影响:◦ display: none:子元素也会被隐藏。◦ visibility: hidden:子元素可通过 visibility: visible 单独显示。2. 三列布局(两边固定,中间自适应)方案1:Flex 布局.container { display: flex; }  .left, .right { width: 200px; }  .center { flex: 1; }  方案2:Calc 计算.center { width: calc(100% - 400px); margin: 0 200px; }  方案3:绝对定位 + margin.container { position: relative; }  .left, .right { position: absolute; width: 200px; }  .center { margin: 0 200px; }  3. 闭包• 定义:函数内部引用外部作用域变量,且变量在外部作用域释放后仍被保留。• 作用:实现私有变量、函数防抖/节流等。• 注意:过度使用可能导致内存泄漏。4. React 状态管理方案及区别方案 特点 ** useState** 组件级状态,适合简单逻辑。 ** useContext** 跨组件状态,适合全局轻量级状态(避免逐层传递 props)。 ** Zustand** 轻量级全局状态管理,基于 Context + immer,支持订阅和模块化。 ** Redux** 复杂全局状态管理,需手动配置 reducer、action 等,适合大型应用。 5. 虚拟列表实现• 核心原理:仅渲染可见区域内的列表项,通过滚动事件动态计算并更新显示内容。• 关键步骤:1. 计算可见区域起始索引和结束索引。2. 渲染对应索引的列表项。3. 通过 transform 或 padding 模拟滚动位置,保持滚动条正常显示。6. React 性能优化• 组件优化:◦ 使用 React.memo 缓存函数组件,避免无必要重渲染。◦ useCallback 缓存回调函数,避免子组件因引用变化重渲染。• 状态优化:◦ 避免在 useState 中存储不必要的状态(如临时计算值)。◦ 使用 useReducer 处理复杂状态逻辑,减少重复更新。• 其他:◦ 虚拟列表/表格(长列表优化)。◦ 懒加载(React.lazy + Suspense)。◦ 避免内联函数在渲染中重复创建。7. React 的状态(补充常见问题)• 状态更新异步性:◦ 合成事件和生命周期中,setState 异步更新,需通过回调获取最新值。◦ 原生事件(如 setTimeout)中,setState 同步更新。• 状态穿透问题:◦ 多层组件传递状态时,可用 useContext 或状态管理库简化。8. 代码题:生成有效括号组合(回溯法)var generateParenthesis = (n) => {    const res = [];    const backtrack = (path, left, right) => {      if (path.length === 2 * n) res.push(path);      if (left < n) backtrack(path + '(', left + 1, right);      if (right < left) backtrack(path + ')', left, right + 1);    };    backtrack('', 0, 0);    return res;  };  思路:通过回溯法枚举所有可能,用 left 和 right 控制左右括号数量,确保任意时刻 right ≤ left 且总数不超过 n。
点赞 评论 收藏
分享
在实际项目中常用的设计模式有如下几种:https://www.nowcoder.com/issue/tutorial?zhuanlanId=Mg58Em&uuid=1a0513f768dd42e88065708ac3b1237f单例模式(Singleton):应用于需要保证全局只有一个实例的情况,例如数据库连接池、线程池。工厂模式(Factory):应用于创建对象实例的场景,隐藏实际创建逻辑,提供一个统一的接口。观察者模式(Observer):应用于一对多的依赖关系,当一个对象状态发生改变时,其依赖的对象会自动进行更新。适配器模式(Adapter):应用于将一个类的接口转换成客户端所期望的另一种接口,常用于旧代码的升级与兼容。策略模式(Strategy):应用于根据不同的策略做出不同的处理,例如支付方式的选择、排序算法的选择等。装饰器模式(Decorator):应用于为对象动态添加额外的功能,而不需要修改其原始代码。模板方法模式(Template Method):应用于定义算法的骨架,将一些步骤的具体实现延迟到子类中。命令模式(Command):应用于将请求封装成具体的对象,使得可以用不同的请求对客户进行参数化。迭代器模式(Iterator):应用于提供一种方法来访问一个容器对象中的各个元素,而无需暴露其内部结构。组合模式(Composite):应用于将对象组合成树形结构以表示部分-整体的层次结构,使得用户对单个对象和组合对象的使用具有一致性。
点赞 评论 收藏
分享
评论
12
53
分享

创作者周榜

更多
牛客网
牛客企业服务