算法打工人阿旺 level
获赞
165
粉丝
199
关注
0
看过 TA
1232
中山大学
2026
算法工程师
IP属地:山东
高级算法工程师,多模态/大模型/搜广推方向辅导
私信
关注
0 点赞 评论 收藏
分享
查看17道真题和解析
0 点赞 评论 收藏
分享
1️⃣一面 1.自我介绍和过项目2.知道 deepspeed 和 megatron 吗,分别介绍一下3.Decoder 文本生成有哪几种方法4.Attention 为什么要做scaled ,不做会怎么样,为什么用根号 d _ k5.说一下 Decoder 的因果注意力, QKV 分别来自哪6.深挖多模态大模型论文用的video - llama ,讲一下大模型的结构7.LoRA 初始化怎么做的,用的秩是多少,为什么不选其他的数8. 介绍一下 ALBEF 、 BLIP2️⃣二面1.介绍多模态论文2.论文用了CoT,讲一下论文的CoT是怎么样的3.介绍transformer 架构4.BLIP2的结构是什么,两阶段怎么训练的,有哪些损失5.知道 PEFT 吗,讲一下 LoRA6.LoRA 是什么,有什么好处7.Transformer 怎么做加速训练,训练和推理有什么区别8.一些场景题3️⃣三面1.过项目2.讲一下你用的大模型是什么结构,特征是怎么喂给大模型的3.讲一下multi-head attention,用pytorch手撕一下,要可以实现cross attention的4.大模型训练为什么不用SFT5.知道RLHF吗,讲一下训练流程6.问了几个电商相关的场景题,用大模型解决 prompt 应该怎么设计,怎么处理prompt的输出,怎么过滤错误格式的输出📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
0 点赞 评论 收藏
分享
1️⃣RAG 有哪几个步骤?Step1:将文本分割成块;Step2:使用编码模型将这些块嵌入到向量中,将所有这些向量放入索引中;Step3:LLM 创建一个提示,告诉模型根据我们在搜索步骤中找到的上下文来回答用户的查询。2️⃣实际项目中RAG有哪些优化技巧?首先召回源会考虑多路召回,在召回后面增加一个重排序的阶段,提升召回的质量。另外,重排序模型以及生成模型会根据系统问答的指标情况,进一步微调。3️⃣RAG 中为什么会出现幻觉?出现幻觉问题主要分为两大类,一是生成结果与数据源不一致,训练数据和源数据不一致、数据没对齐或者编码器理解能力的缺陷导致;二是用户问题超出了大模型的认知,用户的问题不在语言模型认知范围内导致。4️⃣RAG 一般怎么做效果评估?RAG 做效果评估主要是针对检索和生成两个环节。对检索环节,我们可以采用 MRR 即平均倒排率,前 k 项的 Hits Rate 命中率, NDCG 排序指标等。生成环节首先是量化指标,再评估生成答案的多样性,看看模型是否能够生成多种合理且相关的答案。还需要引入人类评估,考虑资源效率。5️⃣针对幻觉的问题,有什么解决思路?加入一些纠偏规则,比如采用 ReAct 的思想,让大模型对输出的结果进行反思。还有一种思路是集成知识图谱,即不再局限于向量数据库匹配,做召回时不仅考虑文档块,同时还考虑图谱的三元组。将知识图谱( KGs )集成到 RAG 中,通过利用知识图谱中结构化且相互关联的数据,可以显著增强当前 RAG 系统的推理能力。6️⃣在实际做项目中,经常遇到各种边界的 case ,一般怎么解决?这个需要分情况来看,首先是无效问题:如果对于知识库中没有的问题,我们需要做一个准入的判别,判断是否需要回答。一般是一个二分类模型,或者直接用大模型+ prompt 来做,使模型在这种情况下输出一个预设的兜底话术。第二个是减少幻觉,在推理模块中添加规则和提示工程技术。还有一种是格式错误:模型可能会生成无法解析的答案,这种可以设计一个备份的代理大模型,当解析失败时,可以基于代理大模型直接生成简洁准确的总结。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看6道真题和解析
0 点赞 评论 收藏
分享
查看16道真题和解析
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务