字节Tiktok直播多模态一面 面麻了

发一下问题给大家参考,攒攒人品!!!
1.项目是基于自己的兴趣,还是follow现成项目
2.这个项目是主要是为了解决什么问题
3.训练是基于 torch 写的,还是用现有的框架
4.保存加载checkpoint怎么实现的
5.项目怎么做到能跑起来?遇到什么困难?怎么解决?
6.Qwen tokenizer 中并没有图像相关的 token,那么在构建多模态输入时,应该如何在文本序列中表示图像位置
8.占位 token 在经过 tokenizer 和embedding 后,模型是否能够稳定地识别它的存在?它在 embedding 空间中是否具有明确的语义位置,还是只是一个噪声 token
9.你用什么指标测模型
10.Deepspeed
11.zero123
12.Zero3 是模型并行吗
13.8 卡环境下使用 ZeRO-3 训练时,数据并行度是多少
14.Megatron
15.8 卡环境下使用Megatron训练时,数据并行度是多少
16.训过PPO吗
17.PPO 的reward model是怎么训的
18.PPO 再往底层学了吗?讲一下蒙特卡洛和 TD error 的区别
19.为什么他们是两个极端
20.PPO 加载了哪几个模型?哪些模型是freeze,哪些是激活的?以及它每个模型做了什么
21.你的PPO 的 critic model 是怎么初始化的
22.LLM场景下,传统强化学习中的核心概念(Actor、Environment、State、Action、Reward、Value)分别对应什么
23.R和V的关系?Value 函数在估计什么量
24.DPO和PPO的关系
25.DPO加载几个模型
26.DPO的推导
27.重要性采样两个pi的比值落实到代码层面是什么计算的
28.LLaVA-one-vision、LLaVA-NeXT
29.llava怎么实现动态分辨率的
30.qwenvl系列是如何实现动态分辨率的
31.了解qwenvl系列吗
32.qwenvl在旋转位置编码上的改进
33.场景题:在视频多模态模型(如 Qwen-3B / Qwen-Omni)中,模型存在 video grounding 不准确和“幻觉定位”的问题。如何系统性地设计数据、训练策略、评估与约束机制,来有效提升模型的事件定位准确性
34.根号dk的作用
35.手撕self-attention
全部评论
这么难吗
点赞 回复 分享
发布于 02-10 22:26 广东

相关推荐

04-09 14:15
门头沟学院 Java
攒攒人品!有面试过同岗的朋友欢迎评论区交流1. 实习拷打2.项目拷打3. 详细介绍一下agent项目的核心功能?4. 智能运维助手的"运维"具体如何定义?5. 系统有哪几个主要的组成部分?6. Spring ai alibaba覆盖了你上面说的哪些部分?7. Planner/Executor/Supervisor模式的优点是什么?比如说我接收一个请求的处理,它的优点是什么?8. 在Planner/Executor/Supervisor模式中,拆分为3个agent和只使用1个agent,最关键的优势和区别是什么?9. 介绍RAG的核心流程?10. 召回和重排用的什么算法?(没用重排,道歉)11. 为什么要做RAG?12. 模型回复效果不好的话,如何在RAG层面采取优化措施?如何通过微调采取优化措施?微调属于预训练还是后训练?13. 简单对比一下MySQL和Redis各自的特点?14. MySQL的"关系型"是什么意思?15. Redis能不能做存储,而不仅仅是缓存?16. 场景题: Java多线程并发模型相关: 比如说我有这么一个场景,总体上是一个生产消费的一个模型,但是这个整个的任务的量比较大。就是比如说我有很多的任务,然后可能有成千上万个生产者消费者。比如说有1万个生产者生产消息,然后有5万个消费者消费消息,或者叫任务或者消息或者数据都可以吧。然后因为整体任务量很大嘛,所以大家要去并发去生产和消费。能简单说一下,这样的话用Java的并发模型和并发控制所相关的这个机制怎么去实现,就口述就可以17. 手撕: lc 224.基本计算器(hard) 限时20min
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务