秋招第一面:快手大模型应用

8.19
自我介绍
问最近的一个实习项目,是做口腔大模型的:(侧重于模型训练)
1.数据集规模、筛选和配比
2.超参数有哪些。学习率的选择,怎么寻找超参。小规模数据,怎么跑的,是串行还是并行。loss曲线怎么看的
3.DeepSpeed介绍,用的什么配置(zero_2)
4.为什么选择 Qwen1.5-32B-chat (就俩卡,用57B跑的太慢)
5.BLEU-4的计算公式
5.模型评估是怎么做的?

第二个实习经历,是做的RAG(侧重于模型底层原理)
1.lora介绍,秩的数学意义,怎么计算矩阵的秩
2.多路召回是怎么实现的
3.向量模型和重排模型的微调是怎么做的
4.交叉熵的计算公式。在前向传播的时候为什么选择交叉熵作为loss,为什么不用mse(为什么
5.在模型预测的时候,softmax是把词表的全部token的概率都归一化吗?词表都很大,怎么加速计算(我也没算过啊

本科的项目经历,是一个微博舆情主题及情感演化的时空分析,GitHub上500多star。(侧重于项目设计思路)
1.项目的选题和意义
2.项目的设计框架

算法题:
最大连续子数组和。有印象,但是写得太快了没定义好,出现了很多bug,在面试官不断提醒错了后逐步debug出来了。

没咋考RAG,更多的是模型侧的,有些没有学到那么深。应用我以为是重点考RAG呢,复习重点错了
#快手求职进展汇总##你的秋招第一面感觉怎么样##九月投秋招是不是太晚了?#
全部评论
佬投的杭州还是北京呀
1 回复 分享
发布于 2024-08-22 20:26 北京
第一面很厉害了
1 回复 分享
发布于 2024-08-21 23:50 黑龙江
同学,考虑字节商业化LLM算法嘛~
点赞 回复 分享
发布于 2024-09-03 10:47 北京
m
点赞 回复 分享
发布于 2024-09-01 12:15 浙江
佬,请问RAG评估的话一般怎么回答呀
点赞 回复 分享
发布于 2024-08-24 01:03 北京
佬是投正式批吗
点赞 回复 分享
发布于 2024-08-20 17:26 北京

相关推荐

攒攒人品!有面试过同岗的朋友欢迎评论区交流1.项目拷打2.项目中实际 QPS、延迟、数据规模是多少?瓶颈在哪,怎么解决的?3.讲一个你做过的技术选型,为什么选它?有没有更优方案?4.设计一个支持多轮对话+工具调用的 Agent,整体架构怎么拆?5.Prompt 如何设计才能降低 hallucination?有哪些工程手段?6.多轮对话中上下文过长怎么处理?裁剪策略有哪些?7.Agent 调多个工具时,如何做调度、重试和兜底?8.function calling / tool calling 的实现原理是什么?9.一条 query 在 RAG 系统中的完整链路是怎样的?10.BM25 和向量召回各自优缺点?线上如何融合?11.embedding 模型选型时要考虑哪些指标?12.query rewrite / 多 query 扩展的原理是什么?有什么风险?13.rerank 模型为什么必要?一般放在哪一层?14.HNSW 的核心结构是什么?为什么查询效率高?15.IVF、PQ、HNSW 的区别和适用场景?16.向量索引如何支持高并发查询和在线更新?17.embedding 维度过高会带来什么问题?如何优化?18.文档 chunk 如何切分?长度和重叠怎么设计?19.如何解决 chunk 切分带来的语义断裂问题?20.知识库如何做增量更新并保证一致性?21.多模态数据(图文/表格)如何统一建索引?
点赞 评论 收藏
分享
评论
11
64
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务