秋招第一面:快手大模型应用

8.19
自我介绍
问最近的一个实习项目,是做口腔大模型的:(侧重于模型训练)
1.数据集规模、筛选和配比
2.超参数有哪些。学习率的选择,怎么寻找超参。小规模数据,怎么跑的,是串行还是并行。loss曲线怎么看的
3.DeepSpeed介绍,用的什么配置(zero_2)
4.为什么选择 Qwen1.5-32B-chat (就俩卡,用57B跑的太慢)
5.BLEU-4的计算公式
5.模型评估是怎么做的?

第二个实习经历,是做的RAG(侧重于模型底层原理)
1.lora介绍,秩的数学意义,怎么计算矩阵的秩
2.多路召回是怎么实现的
3.向量模型和重排模型的微调是怎么做的
4.交叉熵的计算公式。在前向传播的时候为什么选择交叉熵作为loss,为什么不用mse(为什么
5.在模型预测的时候,softmax是把词表的全部token的概率都归一化吗?词表都很大,怎么加速计算(我也没算过啊

本科的项目经历,是一个微博舆情主题及情感演化的时空分析,GitHub上500多star。(侧重于项目设计思路)
1.项目的选题和意义
2.项目的设计框架

算法题:
最大连续子数组和。有印象,但是写得太快了没定义好,出现了很多bug,在面试官不断提醒错了后逐步debug出来了。

没咋考RAG,更多的是模型侧的,有些没有学到那么深。应用我以为是重点考RAG呢,复习重点错了
#快手求职进展汇总##你的秋招第一面感觉怎么样##九月投秋招是不是太晚了?#
全部评论
佬投的杭州还是北京呀
1 回复 分享
发布于 2024-08-22 20:26 北京
第一面很厉害了
1 回复 分享
发布于 2024-08-21 23:50 黑龙江
同学,考虑字节商业化LLM算法嘛~
点赞 回复 分享
发布于 2024-09-03 10:47 北京
m
点赞 回复 分享
发布于 2024-09-01 12:15 浙江
佬,请问RAG评估的话一般怎么回答呀
点赞 回复 分享
发布于 2024-08-24 01:03 北京
佬是投正式批吗
点赞 回复 分享
发布于 2024-08-20 17:26 北京

相关推荐

昨天 03:25
门头沟学院 Java
给我面没招了,发点面经攒攒人品~1.实习拷打2.论文拷打3.毕业是否有发表论文的要求?4.你自己有没有准备要发表论文?5.请详细聊一聊你的项目经历。你可以先讲一下"生活优选"这个项目是怎么做的。6.这个项目是基于某个开源项目做了二次开发,还是从零开始搭建的?7.请讲一下这个项目的整体架构是怎样的。8.你觉得这个项目中最有挑战性或者最难的地方是哪里?9.你这个服务是分布式的,还是单机部署的?10.你最初在MySQL中实现秒杀逻辑时,具体是用什么SQL语句来保证不超卖和一人一单的?11.为什么你认为MysqI不能保证原子性?12.如果使用update table set stock=stock-1wherestock>0,这个语句本身是原子性的,为什么你会觉得它无法防止超卖?13.你在Redis中是如何实现秒杀逻辑的?具体用了什么数据结构或脚本?14.既然你的系统是单机部署,为什么不在JVM内存中使用本地锁,而要去使用Redis增加额外的开销和复杂度?15.你之前面试过哪些公司或团队?是什么方向的?16.你这个项目是如何部署的?17.有没有尝试过部署到云服务器上?18.是否使用过Docker或Kubernetes等容器技术?你对此有什么了解?19.你在项目中使用了乐观锁和悲观锁来解决订单支付与关单的并发问题,请详细讲一下具体是如何实现的。20.悲观锁在数据库层面如何显式加锁?21.乐观锁和悲观锁分别适用于什么场景?有没有选择的原则?
点赞 评论 收藏
分享
评论
11
64
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务