字节AI算法 二面 好难啊
发点面经攒攒人品
1、你在线上或离线训练时,过拟合怎么处理?直接说你最有效的三个方法和拿到的收益。
2、把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同;跟 LN、GN 比,分别什么时候用、怎么取舍。
3、分类和回归你最常用哪些损失?你更偏好哪几个,为什么(从鲁棒性、梯度、数值稳定性上谈)。
4、L1 和 L2 正则你怎么选?它们各自的效果与风险是什么,工程里你是怎么权衡的。
5、二元和多分类的交叉熵你怎么写?在工程里你怎么做数值稳定实现。
6、AUC 到底在统计上代表什么?你怎么计算它,在线上业务里你如何解释“这次 AUC 提升”的含义。
7、你做 CTR/CVR/CTCVR 联合建模时,ESMM/ESMM2 是怎么推导与工程落地的?线上到底带来了什么收益。
8、Transformer 里因果注意力的 Q/K/V 各从哪来?Mask 具体怎么实现。
9、Scaled Dot‑Product Attention 为啥要除以 √dk?如果不除会出什么数值或训练问题。
10、把 Transformer / Decoder‑only 的整体结构过一遍,各个组件分别在干什么,有哪些常见变体。
11、位置编码这条线你怎么选:绝对 PE、相对 PE、RoPE 各自的思路、优势和局限,结合你的项目谈取舍。
12、长上下文怎么搞?Rope scaling、Position Interpolation、KV Cache 管理、检索增强、窗口注意力,你的实战方案是什么。
13、KV Cache 在训练和推理中的差异是什么?它的加速价值有多大,吞吐与延迟你是如何权衡的,vLLM/paged‑attention 需要注意什么。
14、PEFT 方案里(LoRA/QLoRA/Prefix/Prompt‑Tuning/Adapter)你怎么选?说说稳定训练的经验。
15、SFT 和对齐(RLHF/DPO/IPO/PPO)原理差在哪?在不同数据与资源条件下,你怎么选路线。
16、RAG 系统你怎么设计?切分、索引、召回/重排、压缩/融合、兜底策略怎么串。
17、提示词工程你是怎么搞的?System/角色/约束/分步指令怎么写,如何防越狱
1、你在线上或离线训练时,过拟合怎么处理?直接说你最有效的三个方法和拿到的收益。
2、把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同;跟 LN、GN 比,分别什么时候用、怎么取舍。
3、分类和回归你最常用哪些损失?你更偏好哪几个,为什么(从鲁棒性、梯度、数值稳定性上谈)。
4、L1 和 L2 正则你怎么选?它们各自的效果与风险是什么,工程里你是怎么权衡的。
5、二元和多分类的交叉熵你怎么写?在工程里你怎么做数值稳定实现。
6、AUC 到底在统计上代表什么?你怎么计算它,在线上业务里你如何解释“这次 AUC 提升”的含义。
7、你做 CTR/CVR/CTCVR 联合建模时,ESMM/ESMM2 是怎么推导与工程落地的?线上到底带来了什么收益。
8、Transformer 里因果注意力的 Q/K/V 各从哪来?Mask 具体怎么实现。
9、Scaled Dot‑Product Attention 为啥要除以 √dk?如果不除会出什么数值或训练问题。
10、把 Transformer / Decoder‑only 的整体结构过一遍,各个组件分别在干什么,有哪些常见变体。
11、位置编码这条线你怎么选:绝对 PE、相对 PE、RoPE 各自的思路、优势和局限,结合你的项目谈取舍。
12、长上下文怎么搞?Rope scaling、Position Interpolation、KV Cache 管理、检索增强、窗口注意力,你的实战方案是什么。
13、KV Cache 在训练和推理中的差异是什么?它的加速价值有多大,吞吐与延迟你是如何权衡的,vLLM/paged‑attention 需要注意什么。
14、PEFT 方案里(LoRA/QLoRA/Prefix/Prompt‑Tuning/Adapter)你怎么选?说说稳定训练的经验。
15、SFT 和对齐(RLHF/DPO/IPO/PPO)原理差在哪?在不同数据与资源条件下,你怎么选路线。
16、RAG 系统你怎么设计?切分、索引、召回/重排、压缩/融合、兜底策略怎么串。
17、提示词工程你是怎么搞的?System/角色/约束/分步指令怎么写,如何防越狱
全部评论
相关推荐
查看7道真题和解析 点赞 评论 收藏
分享
26想校招上岸的菜鸟:但是不可否认的是 leader想要3个 结果投了1000个 领导筛了100个面试 当leader找到了满意的3个 让他们继续二面 但是同时 其他的97个也会让你一面 因为已经约面了总不能毁面吧 因为leader也不确定那3个能不能过后面的面试,以及来不来 因此 这97个有一部分作为那3个的后续 剩下的 就是走个过场 面完就挂 这就是我个人认为的kpi面
点赞 评论 收藏
分享
小柒正在找工作:不是27届的可以吗😭
点赞 评论 收藏
分享