字节大模型二面面经

全长25分钟不到,面试官感觉很随意
感觉被kpi了,一个月被两次kpi😅

开头自我介绍+项目简介   5分钟

八股5分钟
1.transformer,encorder-decorder
2.mutihead-attention,qkv矩阵
3.gpt和bert的结构
4.位置编码,transformer和bert和gpt的都问了
5.QLora的原理,量化类型

场景题
1.多个不同长度的句子怎么转为相同长度的embedding,说出用模型和不用模型的方法

2.知道多个词向量怎么表示出整个句子,说出用模型和不用模型的方法

算法题:
三角形最短路径和,类似于杨辉三角,最优解应该是dp,但是最近写dfs比较多,就用dfs写了

感觉面试官很赶时间,一上来节奏很快,八股答得还行,场景题…寄了,算法应该是A了,等结果吧,别第一次面大厂百度和字节都被kpi



更新:已挂,回去沉淀去了
全部评论
一上来就问八股 感觉也太kpi了,如果不关注你项目可能基本就挂了 所以也没别在意 就是单纯一开始就不打算要你
点赞 回复 分享
发布于 2024-08-17 10:29 浙江
想问下哪里有比较全的大模型八股呢?
点赞 回复 分享
发布于 2024-08-16 18:04 江苏
楼主是本科还是硕士呀
点赞 回复 分享
发布于 2024-08-01 22:09 江苏
是提前批还是秋招正式批呢
点赞 回复 分享
发布于 2024-07-30 13:20 北京
是豆包大模型嘛?
点赞 回复 分享
发布于 2024-07-29 18:33 广东

相关推荐

攒人品中,祝大家都能拿到满意的Offer!1.项目拷打2生成式推荐本质上是在做隐空间到离散iD的映射,你如何证明你生成的 ID 序列保留了用户意图的最优压缩3.比如广告场景下不仅仅是预估 CTR。如果我们将生成式排序引入 GSP拍卖,大模型生成的候选列表概率分布,如何保证满足激励相容性4如果模型生成的排序导致广告主出现竞价上的博弈呢5.在H100集群上跑生成式重排,现在的瓶颈不在计算而在存储带宽。如果分阶段推理,我在Prefill阶段采用了FlashAttention-3,但在 Decoding 阶段因为 KV Cache 导致的Fragmented Memory太严重,怎么办6.推荐系统要求毫秒级响应对于1B规模的排序模型,如果我要做Speculative Decoding,你如何设计那个Draft Model?这个小模型是该学大模型的 Logits 分布,还是该学用户的Embedding聚类7.假设构建一个端到端生成式广告系统。现在面临一个场景:某个新入驻的土豪广告主投放了一批高质量视频,但由于模型对新 ID 的 Semantic Indexing 尚未完全对齐,导致第一波推荐给了错误的人群,产生了极高的 Negative Feedback,生成式模型的自回归特性会不断放大这种“第一印象”,导致该广告主瞬间被屏蔽你如何设计一套Online Counterfactual Correction这种,在不重新训练模型的前提下,通过修改 KV Cache里的隐藏状态来强行挽回这批广告的生命周期9.在短视频重排阶段使用了一个 10B 的生成式模型但是业务反馈说模型在学会了今天最火的某个梗以后,竟然忘记了如何处理用户对“长尾科普视频”的旧兴趣,发生了明显的 Catastrophic Forgetting,设计一种基于 Gradient Orthogonal Projection的优化器,确保模型在更新实时热点知识时,参数更新量在旧知识的Null Space内。10.都知道生成式模型有位置偏差从 Attention Entropy 的角度来看,为什么 $N$ 个候选 Item 在序列中的排列顺序会直接导致 Logits 的非线性漂移
查看9道真题和解析
点赞 评论 收藏
分享
04-01 10:58
门头沟学院 Java
AI Coding早已成为程序员和求职党提升效率的核心工具,但很多人只用它“抄代码”,却没掌握核心技巧,反而浪费了工具价值。结合自身实操经验,分享几个实用的AI Coding实战技巧,不管是日常练习还是笔试刷题,都能帮你少走弯路、提升效率。• 核心技巧一:结构化提示词,让AI精准输出。很多人用AI写代码时,只简单说“写一个笔试编程题”,结果AI输出的代码要么不符合需求,要么冗余复杂。正确的做法是,明确题型、需求、约束条件和输出格式,比如“用Python写一道数组排序的笔试编程题,要求时间复杂度O(nlogn),输出完整代码+注释,适配LeetCode中等难度”,结构化提示能让AI精准匹配需求,减少修改成本。• 核心技巧二:善用AI排错,高效解决bug。新手写代码最头疼的就是调试bug,反复排查却找不到问题所在。此时可以将报错信息、相关代码片段一起发给AI,明确提示“帮我排查这段代码的bug,说明错误原因,并给出修改后的完整代码”,AI不仅能快速定位bug,还能解释错误逻辑,帮你吃透知识点,比自己盲目排查高效得多。• 核心技巧三:遵循工程规范,让AI输出更规范。求职笔试和实际工作中,代码规范很重要,AI输出的代码有时会忽略命名规范、注释缺失等问题。可以在提示词中加入规范要求,比如“代码遵循PEP8规范,变量命名清晰,关键步骤添加注释,避免冗余代码”,长期坚持,既能让AI输出更规范,也能培养自己的良好编程习惯。• 核心技巧四:不依赖AI,边用边学。AI只是辅助工具,不能完全依赖它写代码。正确的用法是,先自己梳理解题思路,写出核心逻辑,再用AI优化代码、排查bug,对比自己的写法和AI的差异,查漏补缺。比如笔试刷题时,先尝试独立解题,遇到瓶颈再用AI提示思路,避免直接复制代码,才能真正提升自身编码能力。其实AI Coding的核心不是“抄代码”,而是用工具帮我们节省时间、补齐短板。掌握这些实战技巧,既能提高编码效率,也能在实操中积累经验,不管是应对笔试还是日常工作,都能事半功倍,尤其适合新手快速入门、提升实力。
AI Coding实战技...
点赞 评论 收藏
分享
祝大家都能拿到满意的Offer!1.项目拷打2.你们这里说的分层混合编排式 Agent 架构设计是具体怎么做的3.我问一个就是你们在Routing那里,你会根据难度去做不同的一个处理,对吧?那你们这个难度是怎么划分的呢4.你刚才提到就是说,比方说如果刚开始有动态升级的一个范式,就是比方说这个任务刚开始被分配到了7B但是如果它在生成的过程当中,置信度或者说生成的结果它的置信度比较低,你们这个置信度是怎么生成的呢5.你们大概配备了多少个工具6.以风险评估为例,你们的输入输出分别是什么呢7.你的字段是什么8.比方说你说的收缩压这个字段,在用户的问题当中可能不会有这样的一个检测数据。那这种情况你们是怎么来处理呢9.我看到你这里有说在引入了应用层的MOE按照任务动态的激活专家路径,这个具体是怎么实现的呢10.这里就有个问题,我们针对不同的科室去训练一个微调专家,那你们是你们怎么训练的呢?怎么针对于不同科室去训练的,第二个问题就是逻辑上你们这个专家数量可不会少,然后你们的工作量会比较大,这个问题你们又是怎么解决的呢11.你们最终大概是用了多少个专家12.每个大概训练的数据量是多少呢13你们的这个70b模型用的是自己?从头开始预训练的吗?还是用的开源的14那你们医疗数据你们医疗数据的主要来源是在哪里呢?
查看14道真题和解析
点赞 评论 收藏
分享
评论
8
54
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务