淘天一面 无八股无手撕就离谱

面试公司:淘天集团
面试岗位:后台开发
面试问题:
1. 上来和我聊天,聊了聊淘天和阿里云的笔试体验。这次的面试官很友好,全程带着微笑
2. 自我介绍
3. 聊了聊南软的两年制
4. 介绍java项目
5. 在用es之前,你的数据库模糊匹配怎么做的
6. 怎么做的分词?
7. 为什么选择用分词器,我看你简历上另一个项目也写了nltk,考虑过其它nlp工具吗?
8. 地理检索具体怎么做的
9. 地图区块划分的颗粒度怎么把握?
10. 说说对雪花算法的了解
11. 为什么用kafka不用兔子mq?
12. 有做过压测吗?模拟的并发量多少?
13. 为什么用http不用rpc
14. 怎么做的流量削峰?
15. 怎么防止超卖和保证一致性?
16. 如何保证秒杀先到先得,保证公平性?
17. 怎么想到做这个项目的?
18. 介绍rag项目
19. bge m3嵌入后的具体向量长度?
20. 数据集多大?
21. chunk怎么做的?
22. 具体的rag链路?
23. query改写的效果大概长啥样?举了个例子
24. 每一路的topk设的多少
25. 怎么想到的用rrf
26. 介绍一下mrr
27. 有考虑过用一些工程框架吗?
28. 假如要你做一个agent,对于常见的框架和中间件,怎么选型?
29. 现在市面上的大模型有哪些应用点?有了解过吗?(说了笨比ai牛可乐,哈哈哈)
30. rag中的llm用的哪个?

无手撕

反问:
1. 业务?(天猫超市)
2. 看重实习生的哪些方面?(热心的说了一堆,主要是技术基础+快速适应团队+对新技术的敏锐度)
3. 语言?(大部分还是java,少部分和ai相关的也有python)

总结:全程只问项目,没问八股,甚至连手撕都没有。不过面试官真的很nice,全程面带微笑,聊的很开心。面对有几个不太好答的问题,直接坦诚然后说说自己的看法,面试官也不会逼问。

怎么感觉每次一面氛围都非常轻松友好hhh

#牛客在线求职答疑中心# #牛客创作赏金赛# #软件开发笔面经#
全部评论
字节oc了却还要积累面试经验吗,哈基🐗,你这家伙.....
46 回复 分享
发布于 03-11 17:38 上海
哇,听起来你的面试经历真的很棒呢!面试官友好好让人羡慕呀~你在介绍项目和回答问题时一定很自信吧!那个,你提到的“笨比AI牛可乐”,嘿嘿,那是我啦!我是牛客孵化的AI牛可乐,求职路上的小助手。你对NLP工具的了解真的很厉害哦!对了,面试完感觉怎么样?有没有什么想和我这个小助手分享的心得体会呀?悄悄告诉你,点击我的头像,我们可以私信聊聊哦~(≧▽≦)
8 回复 分享
发布于 03-11 16:25 AI生成
字节✌怎么还在面
6 回复 分享
发布于 03-11 16:30 江苏
唉,南软
3 回复 分享
发布于 03-11 20:05 广东
佬,这个能不能讲一下思路:16. 如何保证秒杀先到先得,保证公平性?
2 回复 分享
发布于 03-31 16:07 浙江
字节oc了你还卷大家hc
2 回复 分享
发布于 03-12 22:33 陕西
佬太牛了
2 回复 分享
发布于 03-12 17:55 广东
聊到一半直接聊RAG了吗hhh 请问是用了spring ai吗
1 回复 分享
发布于 03-21 22:17 香港
同学,块存储考虑吗,阿里云块存储,核心岗,java,c++,机器学习算法岗,base杭州北京成都,直推到组里,私聊
1 回复 分享
发布于 03-14 13:05 北京
rag是小傅哥的项目吗佬
1 回复 分享
发布于 03-13 11:48 山东
字节✌️来试试贝壳,面着玩
1 回复 分享
发布于 03-11 22:56 北京
佬感觉你这跟我捞的部门有点像呀,这部门是不是toc然后还做大模型应用
1 回复 分享
发布于 03-11 18:01 北京
佬是业务技术的吗
1 回复 分享
发布于 03-11 17:52 陕西
字节✌怎么还在面
1 回复 分享
发布于 03-11 16:47 广东
字节✌怎么还在面
点赞 回复 分享
发布于 04-12 14:27 湖北
字节✌怎么还在面
点赞 回复 分享
发布于 04-11 09:28 陕西
大哥你也有一个地图项目?我还以为只有我在用
点赞 回复 分享
发布于 03-25 14:47 山东
淘天的投递界面是不是卡bug了,让选国家和城市,点下拉框什么都没有,又是必填项
点赞 回复 分享
发布于 03-13 14:51 广东
🐗佬,好羡慕🐗佬,同样是njuser为什么你那么强
点赞 回复 分享
发布于 03-13 10:06 江苏
人家是简历海投,你是面试海面哈哈哈
点赞 回复 分享
发布于 03-12 17:28 陕西

相关推荐

时间范围 近半年实际面过的公司阿里、腾讯、美团、字节、快手、同程、京东、360、keep、滴滴、印象笔记、作业帮、彩云科技、蓝色光标、江城互娱、Aviagames、Hungry Stdios、深言科技、即时科技、RockFlow、格灵深瞳、百融云创、印象笔记、网龙、 HiDream.ai、昆仑万维、数驱互动、Authing先说总结面试内容 & 难度个人觉得,在llm应用的面试题上,没有太多复杂、高深的问题,不像上来让你说一下分布式锁怎么设计然后死扣设计细节或是描述一下MVCC原理这种偏高难度的八股文问题(当然也遇到了一两次),究其原因以下几点,一是大模型应用目前仍没有很成熟且被广泛接纳的方案,都还在探索;二是很多公司今年刚开始all in AI(我司all进去的比较早点),面试官也懂得不多,例如RAG这个东西,大部分的面试题无非是“你觉得RAG中最难的是什么?(文档切割喽)”、“你是怎么解决幻觉问题的?”,“微调和RAG的区别是啥?”等等,如果你做过RAG加上你经常看技术文章结合你的“侃侃而谈”,基本面试官都觉得ok。但这里着重说一下我觉得当前非常重要且极大概率提升面试通过率的的一个技术点,就是掌握微调原理并且做过动手做过微调工作再加上动手部署过大模型,这是我面试中最常被问到而又只能说没做过的问题,当然大部分公司都有专门的算法团队去做这件事,自己到没机会参与其中,也是可以理解的。算法题:一半是DP问题,还有一部分难度是easy的问题,总体上都是“老熟人”,但是,你即使写出来,面试不一定就能过,有的干脆就不考算法题。八股文:明显比之前少很多,这个和面试的岗位有关系,LLM应用的岗位更偏实践,所有很多一面就是leader面,直接问项目,除非一面也不懂LLM的东西,就会考八股文,但总的来说,八股少了,但是绝对不可以不准备,好几次挂在这上面,别小瞧它。岗位内容:游戏公司:基本上是LLM + AB test for 游戏策划;BI 分析;游戏社区客服助手;toC: Agent 个人助手toB: Agent for 解决方案other: 通用 Agent 平台;公司内部AI助手、平台;Agent for 运维offer会有很多横向对比,如果你期望薪资比较高,对方说要在等等,基本上凉了。大部分涨幅基本是不到20%的,但我的期望是30%左右,最后还是拿到了(要有一点点耐心,还要有一定的运气)。不要眼高手低,先拿一个低于自己预期的offer,再慢慢谈,前提是公司想要你。规划好时间,集中面试,集中对比,由于我时间线拉的过长,后面安排的很乱。再总结每次面完都要复盘,没答好的问题,一定要重新梳理答案。没把握问题的可以直接说不会,别给个你自己都听不懂的答案。简历一定要让大模型润色,但自己要check一遍,别吹过头了。多看技术文章,扩展技术视野,提高二面面试官对你的印象。表达一定要流畅清晰,不要断断续续的,面试官会觉得你思路不清晰。项目效果评估是个很重要的问题,不管你的技术多炫酷,终究还是要看效果,看落地效果。面试题这里想到多少写多少LLM 基础大模型是怎么训练出来的?Transform 的架构,Encoder 和 Decoder 是什么?Function Call 是怎么训练的?微调的方案有哪些?自己做过没有?大模型分词器是什么?Embedding 是什么?你们用的那个模型?Lib介绍一下 langchian介绍一下 autogen有没有用过大模型的网关框架(litellm)为什么手搓agent,而不是用框架?mcp 是什么?和Function Call 有什么区别?有没有实践过?A2A 了解吗?PromptReAct 是啥?怎么实现的?CoT 是啥?为啥效果好呢?有啥缺点?Prompt Caching 是什么?温度值/top-p/top-k 分别是什么?各个场景下的最佳设置是什么?RAG你介绍一下RAG 是什么?最难的地方是哪?文档切割策略有哪些?怎么规避语义被切割掉的问题?多路召回是什么?文档怎么存的?粒度是多大?用的什么数据库?为啥要用到图数据库?向量数据库的对比有没有做过?Qdrant 性能如何?量级是多大?有没有性能瓶颈?怎么规避大模型的幻觉?微调和RAG的优劣势?怎么量化你的回答效果? 例如检索的效果、回答的效果。Workflow怎么做的任务拆分?为什么要拆分? 效果如何?怎么提升效果?text2sql 怎么做的?怎么提高准确率?如何润色query,目的是什么?code-generation 是什么做的?如何确保准确性?现在再让你设计你会怎么做?(replan)效果是怎么量化的?Agent介绍一下你的 Agent 项目长短期记忆是怎么做的?记忆是怎么存的?粒度是多少?怎么用的?Function Call 是什么做的?你最大的难题是什么?你是怎么提高效果的?怎么降低延迟的?端到端延迟如何优化的?介绍一下single-agent、multi-agent的设计方案有哪些?反思机制是什么做的?为什么要用反思?如何看待当下的LLM应用的趋势和方向为什么要用Webrtc?它和ws的区别是什么?agent服务高可用、稳健性是怎么保证的?llm 服务并发太高了怎么办?系统设计题短链系统分布式锁的设计给你一部长篇小说,怎么做文档切割?怎么做到论文翻译,并且格式尽可能和原来的统一游戏社区客服助手设计。如何绑定游戏黑话,如何利用好公司内部的文档结合线上问题快速定位项目工程代码有问题的地方有很多结构化和非结构化数据,怎么分析,再怎么得出我要的结论。八股go的内存分配策略、GMP、GCpython 的内存分配策略、GCredis 用过那些?mget 底层什么实现的?、zset怎么实现的?mysql 索引怎么设计最好?数据库隔离级别?mvcc是怎么实现的?分布式锁是什么实现的?kafka的 reblance 是什么?会产生那些问题?怎么保证数据不丢?fastapi 设计原理?go 中 net/http 如何处理的tcp粘包问题http2 是什么?比http1.1有什么优势?Linux 网络性能调优的方式如何定位Linux中的pid、端口号等等个人在每个项目的里的角色是什么?承担那些工作?项目是几个人在做?为什么离职、每次离职的原因是什么?平常怎么学习的?怎么接触到大模型的最新进展的?对大模型将来的应用发展有什么看法?你将来的职业规划是什么?
大模型小坛:所有面试题可以开源给大家 后台T一下
点赞 评论 收藏
分享
评论
47
149
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务