秋招第一面:快手大模型应用

8.19
自我介绍
问最近的一个实习项目,是做口腔大模型的:(侧重于模型训练)
1.数据集规模、筛选和配比
2.超参数有哪些。学习率的选择,怎么寻找超参。小规模数据,怎么跑的,是串行还是并行。loss曲线怎么看的
3.DeepSpeed介绍,用的什么配置(zero_2)
4.为什么选择 Qwen1.5-32B-chat (就俩卡,用57B跑的太慢)
5.BLEU-4的计算公式
5.模型评估是怎么做的?

第二个实习经历,是做的RAG(侧重于模型底层原理)
1.lora介绍,秩的数学意义,怎么计算矩阵的秩
2.多路召回是怎么实现的
3.向量模型和重排模型的微调是怎么做的
4.交叉熵的计算公式。在前向传播的时候为什么选择交叉熵作为loss,为什么不用mse(为什么
5.在模型预测的时候,softmax是把词表的全部token的概率都归一化吗?词表都很大,怎么加速计算(我也没算过啊

本科的项目经历,是一个微博舆情主题及情感演化的时空分析,GitHub上500多star。(侧重于项目设计思路)
1.项目的选题和意义
2.项目的设计框架

算法题:
最大连续子数组和。有印象,但是写得太快了没定义好,出现了很多bug,在面试官不断提醒错了后逐步debug出来了。

没咋考RAG,更多的是模型侧的,有些没有学到那么深。应用我以为是重点考RAG呢,复习重点错了
#快手求职进展汇总##你的秋招第一面感觉怎么样##九月投秋招是不是太晚了?#
全部评论
佬投的杭州还是北京呀
1 回复 分享
发布于 2024-08-22 20:26 北京
第一面很厉害了
1 回复 分享
发布于 2024-08-21 23:50 黑龙江
同学,考虑字节商业化LLM算法嘛~
点赞 回复 分享
发布于 2024-09-03 10:47 北京
m
点赞 回复 分享
发布于 2024-09-01 12:15 浙江
佬,请问RAG评估的话一般怎么回答呀
点赞 回复 分享
发布于 2024-08-24 01:03 北京
佬是投正式批吗
点赞 回复 分享
发布于 2024-08-20 17:26 北京

相关推荐

1️⃣RAG 有哪几个步骤?Step1:将文本分割成块;Step2:使用编码模型将这些块嵌入到向量中,将所有这些向量放入索引中;Step3:LLM 创建一个提示,告诉模型根据我们在搜索步骤中找到的上下文来回答用户的查询。2️⃣实际项目中RAG有哪些优化技巧?首先召回源会考虑多路召回,在召回后面增加一个重排序的阶段,提升召回的质量。另外,重排序模型以及生成模型会根据系统问答的指标情况,进一步微调。3️⃣RAG 中为什么会出现幻觉?出现幻觉问题主要分为两大类,一是生成结果与数据源不一致,训练数据和源数据不一致、数据没对齐或者编码器理解能力的缺陷导致;二是用户问题超出了大模型的认知,用户的问题不在语言模型认知范围内导致。4️⃣RAG 一般怎么做效果评估?RAG 做效果评估主要是针对检索和生成两个环节。对检索环节,我们可以采用 MRR 即平均倒排率,前 k 项的 Hits Rate 命中率, NDCG 排序指标等。生成环节首先是量化指标,再评估生成答案的多样性,看看模型是否能够生成多种合理且相关的答案。还需要引入人类评估,考虑资源效率。5️⃣针对幻觉的问题,有什么解决思路?加入一些纠偏规则,比如采用 ReAct 的思想,让大模型对输出的结果进行反思。还有一种思路是集成知识图谱,即不再局限于向量数据库匹配,做召回时不仅考虑文档块,同时还考虑图谱的三元组。将知识图谱( KGs )集成到 RAG 中,通过利用知识图谱中结构化且相互关联的数据,可以显著增强当前 RAG 系统的推理能力。6️⃣在实际做项目中,经常遇到各种边界的 case ,一般怎么解决?这个需要分情况来看,首先是无效问题:如果对于知识库中没有的问题,我们需要做一个准入的判别,判断是否需要回答。一般是一个二分类模型,或者直接用大模型+ prompt 来做,使模型在这种情况下输出一个预设的兜底话术。第二个是减少幻觉,在推理模块中添加规则和提示工程技术。还有一种是格式错误:模型可能会生成无法解析的答案,这种可以设计一个备份的代理大模型,当解析失败时,可以基于代理大模型直接生成简洁准确的总结。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看6道真题和解析
点赞 评论 收藏
分享
评论
11
63
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务