大智慧有那么值得去吗?给的也不多啊,我看好几个优质学历的都去面这个公司,还被刷了
1 1

相关推荐

发点面经攒攒人品1、你在线上或离线训练时,过拟合怎么处理?直接说你最有效的三个方法和拿到的收益。2、把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同;跟 LN、GN 比,分别什么时候用、怎么取舍。3、分类和回归你最常用哪些损失?你更偏好哪几个,为什么(从鲁棒性、梯度、数值稳定性上谈)。4、L1 和 L2 正则你怎么选?它们各自的效果与风险是什么,工程里你是怎么权衡的。5、二元和多分类的交叉熵你怎么写?在工程里你怎么做数值稳定实现。6、AUC 到底在统计上代表什么?你怎么计算它,在线上业务里你如何解释“这次 AUC 提升”的含义。7、你做 CTR/CVR/CTCVR 联合建模时,ESMM/ESMM2 是怎么推导与工程落地的?线上到底带来了什么收益。8、Transformer 里因果注意力的 Q/K/V 各从哪来?Mask 具体怎么实现。9、Scaled Dot‑Product Attention 为啥要除以 √dk?如果不除会出什么数值或训练问题。10、把 Transformer / Decoder‑only 的整体结构过一遍,各个组件分别在干什么,有哪些常见变体。11、位置编码这条线你怎么选:绝对 PE、相对 PE、RoPE 各自的思路、优势和局限,结合你的项目谈取舍。12、长上下文怎么搞?Rope scaling、Position Interpolation、KV Cache 管理、检索增强、窗口注意力,你的实战方案是什么。13、KV Cache 在训练和推理中的差异是什么?它的加速价值有多大,吞吐与延迟你是如何权衡的,vLLM/paged‑attention 需要注意什么。14、PEFT 方案里(LoRA/QLoRA/Prefix/Prompt‑Tuning/Adapter)你怎么选?说说稳定训练的经验。15、SFT 和对齐(RLHF/DPO/IPO/PPO)原理差在哪?在不同数据与资源条件下,你怎么选路线。16、RAG 系统你怎么设计?切分、索引、召回/重排、压缩/融合、兜底策略怎么串。17、提示词工程你是怎么搞的?System/角色/约束/分步指令怎么写,如何防越狱
查看17道真题和解析
点赞 评论 收藏
分享
1. 介绍某实习公司中负责的关键词命中系统、文档提取系统具备的有特点的功能2. 基于AC自动机构建违禁词匹配的查询结构,在实际应用中是如何实现的3. 某实习公司技术栈中是否考虑过Hive、Spark这类大数据链路的应用4. 关键词命中系统优化的核心目的是否为提升查询性能,具体优化思路是什么5. Redis在关键词命中系统增量更新环节的使用方式,是否存在大key、大value问题6. 说明Redis出现大key、大value(如一个key对应几MB的value)时会引发的问题7. 关键词命中系统中Redis采用订阅发布方式监听时,多key场景下的轮询、监听该如何处理8. 关键词命中系统中处理emoji表情包存储时,涉及的Mysql存储引擎相关知识9. 关键词命中系统中emoji表情包的匹配为何需要用到AC自动机,大批量数据场景下AC自动机的应用逻辑10. 某实习公司中做Mysql治理的具体收获,展开说明相关优化手段11. 介绍某项目中AI相关的实践内容,以及对React agent、Multi agent技术栈的理解和应用12. 某笔记管理网站前后端技术栈的选型思路13. 腾讯云MCP的具体功能,以及其内部提供的工具能力有哪些14. 说明MCP、skill、function call三个概念的区别和相关性15. function call在RAG知识库中的业务逻辑实现细节16. skill在被agent使用后是否会占用上下文,其设计的核心优势是什么17. 开发agent时使用的框架和开发语言分别是什么18. 若要让大模型实现类似cloud code、cursor的编程工具功能,具体该如何实现19. Multi agent中plan的设计思路,以及在实际场景中的应用方式20. agent在长任务执行后上下文接近阈值时,采用何种机制做上下文的压缩21. 开发agent过程中,上下文管理有哪些具体的方式,该如何匹配对应的agent使用场景
查看21道真题和解析
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务