算法打工人小旺

02-28 23:12 中山大学算法工程师发布于山东

关注

阿里淘天大模型一面面经

1️⃣切分策略（ chunk size / overlap ）怎么定的？拍脑袋还是实验出来的？
2️⃣向量召回和关键词召回冲突时如何融合？
3️⃣重排模型为什么这么选？延迟预算是多少？
4️⃣你说线上提升2.1%，实验分桶方案是什么？
5️⃣显著性怎么验证？样本量怎么算？
6️⃣给一个你最失败的 bad case ，最后怎么定位的？
7️⃣如果今天线上再次复现，你第一步看哪个监控？
8️⃣SFT 数据如何清洗，怎么避免模板味太重？12) DPO 比 SFT 多解决了什么真实问题？
9️⃣LoRA rank 为什么这么选？有没有做过 ablation ?
1️⃣0️⃣QLoRA 稳定性问题你遇到过吗？如何兜底？
1️⃣1️⃣手撕：括号生成，要求讲清楚剪枝逻辑。
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

03-04 17:07

南昌大学 Java

后端开发居然有群面嘛，没绷住，让我去看看怎么个事，四个人抢答是吧

点赞评论收藏

分享

03-01 13:26

黑龙江大学 Java

面试问到chunk心慌慌？从企业开发者角度谈一谈具体的chunk策略选择

之前团队在做合同审查和研报问答两个 RAG 项目，踩了不少分块（Chunk）相关的坑。今天把这块经验整理一下，希望对正在做类似事情的朋友有点帮助。先搞清楚 Token 这个概念做 Chunk 之前，得先理解 Token。很多人把 Token 简单等同于"字"或"词"，这不太准确。Token 是模型实际处理的最小单元，中文大约 1.5-2 个字对应一个 Token，英文则大约是 0.75 个单词一个 Token。这件事为什么重要？因为不同类型的文档，Token 密度差异很大。我们实测过：一份 20 页的中文合同，大约 8000-12000 个 Token；...

点赞评论收藏

分享

02-27 10:30

门头沟学院机器学习

网易 llm算法一面凉经面没招了

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1.项目拷打2.你做的日志解析分析项目里涉及爬虫，具体是做什么的?你有相关的爬虫经验吗?3.用一两句话说明你的爬虫能力深度，以及处理过的最复杂的问题是什么样的?有处理过登录验证码、APP相关的反爬场景吗?4.你做的意图识别项目，描述一下面临的问题、产品需求，过程中遇到的技术难点以及解决方法。5.普通策略下意图识别准确率已经达到95%，经过优化后达到了多少?具体做了什么工作让准确率提升的?6.举例说明意图识别项目的业务场景，包括用户的提问方式、模型的解答形式，以及意图类别的设计逻辑。7.意图识别模型的类别除了商品查询、21类操作手册查询，还有别的吗?遇到无关问题时，模型会归类到哪一类，如何处理?8.提升的3%准确率，是不是主要通过完善数据集实现的?如果要进一步提升准确率，你的思路是什么?9.这个实习的项目中你是主导还是配合角色?这些优化思路是领导给的还是自己提出的?10.你做过的所有项目里，有哪些是自己主导的、有成就感的事情?11.你做的编程助手项目借鉴的是哪个开源框架?除了这个框架，还有没有对其他开源框架做过选型工作?12.你看过这个开源框架的完整代码吗?你觉得它的本质是什么?有了解过检索增强、总结洞察相关的内容吗?13.除了这个编程助手项目，还有其他比较有成就感的事情吗?14.谈谈你对Transformer架构中注意力机制的理解，以及它的实现方式。15.讲讲Transformer架构中编码器和解码器的处理过程，以及两者的区别。

查看14道真题和解析

点赞评论收藏

分享

02-21 15:47

上海交通大学算法工程师

阿里大模型一面

岗位名称：大语言模型算法面试时长：1h–1.5h自评分：8/10是否下一轮：是模型架构与基础原理目前主流大语言模型在架构设计上有哪些异同点？（追问）Decoder-only 和 Encoder-Decoder 在实际应用场景上有什么区别？介绍一下大语言模型中的注意力机制，多头相比单头注意力有何优势？（追问）如果减少头数会发生什么？是否一定性能下降？什么是大语言模型的涌现能力？目前对该现象的研究有哪些发现？（追问）涌现能力是否和模型规模线性相关？什么是 Embedding？词嵌入和句嵌入有何不同？（追问）Embedding 层是否会参与微调？为什么？大语言模型中的 Tokenization 是如...

技术必备题库

点赞评论收藏

分享

03-03 17:34

杭州师范大学算法工程师

求agent开发八股资料

求agent开发八股资料

点赞评论收藏

分享

评论

点赞

7

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 交出你的校招焚诀 #

9554次浏览 164人参与

# 27届求职交流 #

1807次浏览 69人参与

# 神州信息求职进展汇总 #

3414次浏览 66人参与

# 实习生至暗时刻 #

16966次浏览 324人参与

# 26届求职交流 #

1653次浏览 51人参与

# 面试___岗的必刷题单 #

11195次浏览 201人参与

# 实习想申请秋招offer，能不能argue薪资 #

224459次浏览 1192人参与

# 米哈游求职进展汇总 #

582737次浏览 2995人参与

# 字节开奖 #

130351次浏览 602人参与

# 哪些公司开暑期实习了？ #

15837次浏览 133人参与

# 你经历过哪些AI幻觉？ #

4631次浏览 114人参与

# 春招开局，你有保底offer吗？ #

23209次浏览 193人参与

# 三月的小目标 #

9301次浏览 176人参与

# AI面试问题分享 #

12158次浏览 252人参与

# 你被哪些公司挂了？ #

148461次浏览 821人参与

# 找AI工作应该卷什么？ #

3516次浏览 68人参与

# 十一月总结 #

82879次浏览 428人参与

# 生化医药面经大本营 #

172319次浏览 549人参与

# 实习生的生存小技巧 #

6375次浏览 106人参与

# 你觉得第一学历对求职有影响吗？ #

234310次浏览 1278人参与

# 我的第一份实习怎么找的 #

236207次浏览 1965人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务