阿里国际agent一面-难死我了

攒人品中,祝大家都能拿到满意的Offer!
1*常见的后训练方法有哪些?它们的优缺点和区别是什么?
2*除了ReAct,目前主流的Agent架构还有哪些
3*在大模型评估中,如何平衡Precision与召回率Recall哪一个指标在Agent任务中更重要?
4*当大模型产生错误回答或幻觉时,在工程和算法层面有哪些规避手段?
5*描述TransformerDecoder的完整解码流程。
6*KL散度的数学意义是什么?在模型对齐(如PPO/DPO)中起什么作用?
7*MoE架构的具体实现原理是什么?路由(Router)是如何工作的?
8*面对模型在生成过程中出现循环、重复回答的问题,有哪些解决办法?
9*BM25算法的数学原理是什么?它相比于简单的TF-IDF有哪些改进?
10*Agent系统中的LangGraph是如何搭建的?其Memory组件的工作机制是怎样的?
11*如果单次生成的任务量远大于模型的MaxTokens限制,如何实现断点继续生成?
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 今天 09:24 广东

相关推荐

昨天 13:35
门头沟学院 Java
攒攒人品!有面试过同岗的朋友欢迎评论区交流1.实习拷打2.项目拷打3.你们的 Agent 是单 Agent 还是多 Agent?为什么这么设计?有没有考虑过另一种方案?4.Agent 任务是怎么拆分的?拆分粒度是怎么决定的?5.上下文是怎么构建的?你们怎么避免上下文过长或者信息污染?6.如果上下文窗口不够,你优先保留哪些信息?为什么?7.你们做代码理解的时候,AST、调用关系这些信息是怎么用起来的?8.单测生成里,哪些代码其实不适合生成单测?你们是怎么识别并过滤的?9.覆盖率高但测试质量很差,这种情况你见过吗?你们是怎么解决的?10.mock在单测里什么时候是必须的?什么时候反而会带来问题?11.如果一个函数依赖数据库和RPC,你怎么让模型生成的单测还能稳定运行?12.你们怎么评估生成单测的质量?除了覆盖率,还有哪些指标?13.LLM的输入到底是什么?模型真正看到的是什么?14.self attention的核心作用是什么,为什么要拆成 QKV?为什么attention 可以建模长距离关系,15.为什么需要multi-head为什么 attention可以看成动态加权16.同一个 token的 Q、K、V 为什么不一样?17.attention复杂度很高,如果上下文特别长,你会怎么优化?18.模型产生幻觉的时候,一般是什么原因?工程上有什么办法降低19.Python有多线程吗?GIL 是干什么的?什么时候多线程是有用的?20.讲一下C++从源码到可执行文件的流程。21.手撕:给定数组的区间中位数之和:给定一个长度为n的数nums,一个区间 [l, r] 的 中位数 为:如果区间长度是奇数:排序后中间的数,如果是偶数:排序后靠左的那个数,要求:计算所有子数组的中位数之和
查看19道真题和解析
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务