阿里国际agent一面-难死我了
攒人品中,祝大家都能拿到满意的Offer!
1*常见的后训练方法有哪些?它们的优缺点和区别是什么?
2*除了ReAct,目前主流的Agent架构还有哪些
3*在大模型评估中,如何平衡Precision与召回率Recall哪一个指标在Agent任务中更重要?
4*当大模型产生错误回答或幻觉时,在工程和算法层面有哪些规避手段?
5*描述TransformerDecoder的完整解码流程。
6*KL散度的数学意义是什么?在模型对齐(如PPO/DPO)中起什么作用?
7*MoE架构的具体实现原理是什么?路由(Router)是如何工作的?
8*面对模型在生成过程中出现循环、重复回答的问题,有哪些解决办法?
9*BM25算法的数学原理是什么?它相比于简单的TF-IDF有哪些改进?
10*Agent系统中的LangGraph是如何搭建的?其Memory组件的工作机制是怎样的?
11*如果单次生成的任务量远大于模型的MaxTokens限制,如何实现断点继续生成?
1*常见的后训练方法有哪些?它们的优缺点和区别是什么?
2*除了ReAct,目前主流的Agent架构还有哪些
3*在大模型评估中,如何平衡Precision与召回率Recall哪一个指标在Agent任务中更重要?
4*当大模型产生错误回答或幻觉时,在工程和算法层面有哪些规避手段?
5*描述TransformerDecoder的完整解码流程。
6*KL散度的数学意义是什么?在模型对齐(如PPO/DPO)中起什么作用?
7*MoE架构的具体实现原理是什么?路由(Router)是如何工作的?
8*面对模型在生成过程中出现循环、重复回答的问题,有哪些解决办法?
9*BM25算法的数学原理是什么?它相比于简单的TF-IDF有哪些改进?
10*Agent系统中的LangGraph是如何搭建的?其Memory组件的工作机制是怎样的?
11*如果单次生成的任务量远大于模型的MaxTokens限制,如何实现断点继续生成?
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
相关推荐
点赞 评论 收藏
分享
查看5道真题和解析