秋招第一面:快手大模型应用

8.19
自我介绍
问最近的一个实习项目,是做口腔大模型的:(侧重于模型训练)
1.数据集规模、筛选和配比
2.超参数有哪些。学习率的选择,怎么寻找超参。小规模数据,怎么跑的,是串行还是并行。loss曲线怎么看的
3.DeepSpeed介绍,用的什么配置(zero_2)
4.为什么选择 Qwen1.5-32B-chat (就俩卡,用57B跑的太慢)
5.BLEU-4的计算公式
5.模型评估是怎么做的?

第二个实习经历,是做的RAG(侧重于模型底层原理)
1.lora介绍,秩的数学意义,怎么计算矩阵的秩
2.多路召回是怎么实现的
3.向量模型和重排模型的微调是怎么做的
4.交叉熵的计算公式。在前向传播的时候为什么选择交叉熵作为loss,为什么不用mse(为什么
5.在模型预测的时候,softmax是把词表的全部token的概率都归一化吗?词表都很大,怎么加速计算(我也没算过啊

本科的项目经历,是一个微博舆情主题及情感演化的时空分析,GitHub上500多star。(侧重于项目设计思路)
1.项目的选题和意义
2.项目的设计框架

算法题:
最大连续子数组和。有印象,但是写得太快了没定义好,出现了很多bug,在面试官不断提醒错了后逐步debug出来了。

没咋考RAG,更多的是模型侧的,有些没有学到那么深。应用我以为是重点考RAG呢,复习重点错了
#快手求职进展汇总##你的秋招第一面感觉怎么样##九月投秋招是不是太晚了?#
全部评论
佬投的杭州还是北京呀
1 回复 分享
发布于 2024-08-22 20:26 北京
第一面很厉害了
1 回复 分享
发布于 2024-08-21 23:50 黑龙江
同学,考虑字节商业化LLM算法嘛~
点赞 回复 分享
发布于 2024-09-03 10:47 北京
m
点赞 回复 分享
发布于 2024-09-01 12:15 浙江
佬,请问RAG评估的话一般怎么回答呀
点赞 回复 分享
发布于 2024-08-24 01:03 北京
佬是投正式批吗
点赞 回复 分享
发布于 2024-08-20 17:26 北京

相关推荐

2025-12-25 11:45
深圳技术大学 Python
这回终于是一个agent开发面了,看着岗位要求吓晕了,准备了好久,不过感觉问的问题都答上来了,不算很难,面试官人很好,还给我解答了缺陷,说怎么大二现在这么卷了1.做自我介绍,并确认是否为 28 届(大二)以及实习政策?2.背景确认: 28 届是 24 年入学的吗?学校是否允许大二出来实习?通勤时间能否接受?3.关于旅行规划助手:双模型动态切换的复杂度是如何判断的?4.核心逻辑: 路由层判定复杂度的准则是什么?如何区分“实际复杂”和“看起来复杂”的任务?5.追问1:针对 1.5B 小模型做路由,是否遇到过’复读机”问题?你是如何解决的?6.追问2:结合高德 MCP 协议,你发现它目前存在哪些问题或局限性?7.追问3:如何通过 MCP 协议实现“加入预算约束”的路线规划?8.大模型能够进行工具调用的底层原理是什么?9.关于魔搭社区问答助手:这个项目的微调数据集是如何获取和设计的?10.追问1:微调后模型的准确率是多少?11.追问2:对于 RAG系统,你本地是如何判断准确率和召回率的?12.追问3:微调过程中是否出现了“灾难性遗忘”?你是如何解决或缓解的?13.LoRA 微调的数学原理是什么?为什么它比全量微调高效?14.多模态与语音交互是如何实现的?15.项目中的自动化流水线是如何串联的?16.确认实习细节:实习周期、每周天数及到岗时间?面试反问环节反问 1:具体实习生进去负责哪个模块?反问 2:面试表现有哪些需要加强的地方?
程序员小假:强啊兄弟
牛客在线求职答疑中心
点赞 评论 收藏
分享
评论
11
63
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务