算法打工人小旺

03-19 22:13 中山大学算法工程师发布于山东

关注

面试官:Embedding 模型到底怎么选？

目前主流的 Embedding 模型都是 Bi-Encoder 架构（双塔模型）：query 和文档各自独立编码成向量，再算余弦相似度。这种架构的优势是速度快——文档向量可以离线算好存起来，查询时只需要算一次 query 的向量就能跟整个库比对。代价是精度不如 Cross-Encoder，所以才需要两阶段检索。

✴️下面是目前开源社区里最常用的几个 Embedding 模型的核心对比：

✅BGE-M3（BAAI 智源）：目前中文场景的首选。支持中英多语言，最大 8192 token 的上下文窗口，同时支持稠密向量、稀疏向量和 ColBERT 式多向量检索三种模式。在 MTEB 中文榜单上长期稳居前列。如果你不知道选什么，无脑选 BGE-M3 不会错。

✅BGE-large-zh（BAAI 智源）：专注中文的大尺寸版本，在纯中文场景下精度略高于 M3，但不支持多语言，上下文窗口也只有 512 token。适合纯中文且文档较短的场景。

✅GTE-multilingual-base（阿里达摩院）：阿里出品的多语言 Embedding 模型，在 MTEB 多语言榜单上表现很强。跟 BGE-M3 是直接竞品关系，两者在多语言场景下各有胜负。如果你面的是阿里，了解 GTE 是基本功。

✅E5-small/base/large（微软）：微软出品，特点是有从 small 到 large 的完整尺寸梯度，small 版本只有 33M 参数，特别适合资源紧张或需要部署到边缘设备的场景。精度比 BGE 略低，但推理速度快很多。

✅Jina Embeddings v2（Jina AI）：最大亮点是支持 8K token 的超长上下文。如果你的文档 chunk 特别长（比如整段法律条文或完整的技术文档章节），其他模型可能截断，Jina v2 能全部吃进去。

✅MiniLM（微软）：极致轻量级，速度最快，适合对延迟要求极高或大批量处理的场景。精度是这几个里最低的，但胜在快。

🌟四种经典搭配方案
1️⃣经典流水线：BGE-base
2️⃣检索 Top 100 → BGE-Reranker-base
3️⃣精排多语言场景：GTE-multilingual-base + GTE-multilingual-rerankerGPU
4️⃣紧张：E5-small + MiniLM-L6-cross-encoder（batch 推理）
5️⃣长文档 / 8K：Jina-embeddings-v2 + Jina-ColBERT-v2，段内匹配更稳

📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

03-31 14:56

广东外语外贸大学大数据开发工程师

字节数开三面

哎，真的心累了，一面二面好不容易都过了，而且印象好像还挺不错的，三面也准备的比较完善了。结果不幸的事情还是发生了，我感觉我能回答的已经很全面到位了，虽然能感觉到大leader应该是非技术出身的，但是有一些奇奇怪怪的问题我是真的有些无奈。自我介绍项目介绍你的项目使用了Paimon，那Spark，Hive这些与Paimon有什么区别为什么使用Paimon，有什么优点实习的时候，你学了什么新技术呢那你说一下离线作业的优化方法Spark参数怎么调？那么除了上面的你说的这些优化，像Hive，Spark或者数据湖这些分布式架构，他们共有的导致数据慢的问题有什么呢？你了解AI的实现技术架构吗？那你认为怎么用...

查看14道真题和解析

点赞评论收藏

分享

04-14 11:06

江南大学算法工程师

现实就是，压榨后辈的师兄进了大厂

我其实也挺好奇的。大家都在说什么抗压，学习能力，但是就论“成绩”这一块，同一个学校的人水平是差不多的。而那些利益导向的人，在读研读博期间，能拿到更多的“成果”（论文、项目），虽然师弟师妹帮他干脏活累活，跑了很多实验，写了很多东西，大家都恨他，但他就是拿着那么多的文章，进了阿里的达摩院。...可能，除了特别特别有天赋的人，和运气特别特别好，有贵人帮助的人，就只有他这种方法能进大厂了吧。作为师妹我讨厌他，但是作为想进大厂的人，我觉得他这条路效率确实高。只要给手下的小兵扔几个活，画画饼，催一催，就等着成果一个一个跑出来。嗯。挺无奈的，也许我就不是能进大厂的命吧。

什么人最适合大厂？

点赞评论收藏

分享

03-27 01:04

美团_测试开发

技术岗面试过程中的非技术注意事项

之前快手实习的时候在电梯里面听到一个老哥问另外一个老哥，面试的时候问什么怎么招什么类型的候选人。那老哥也是坦率，直接说看眼缘，聊得来就行。无论是之前这个快手这个面试官还是现在我认识的很多面试官，绝大多数面试官在面试的过程中多少都会代入部分自己的主观判断。 很多技术岗的小伙伴和我以前一样，只搞技术不在乎其它的一些地方，但是不是每个人都能用绝对的技术来征服面试官的 ，所以很多非技术的点在找工作的时候也很重要，这些非技术的点好似润滑剂，有了润滑剂会让你的求职引擎转动起来更加的丝滑。简历上的图片简历照片的重要性：看过很多人的简历图片和当初博主求职的时候一样，用的大一甚至高中的照片，这里非常推荐如果有时...

打破求职信息差

点赞评论收藏

分享

04-02 14:53

已编辑

河北科技大学 Java

小黑盒春招面经

一直想发的，但因为一面面了 1h47min 让我整理面经就整理了好几天小黑盒面试官有个特点，你要是没回答到他的点上，他就会打断你，会一直深挖整个面试压力爆大，过程中大脑宕机重启宕机重启一面自我介绍介绍下 GMP 是什么东西？如果在早期的 GM 模型中，我们直接给每个 M 分配一个本地队列和上下文资源，不也能解决全局锁冲突的问题吗？为什么非得在 G 和 M 之间，再凭空造出一个 P 的抽象层呢？M 没法窃取吗？为什么非要 P？如果 M 阻塞掉，P 会怎么处理？怎么动态知道 M 会阻塞，并提前退回 P？M 被解绑后，它还有 P 吗？新接手的 M 是哪来的？如果所有的 M 都进行了系统调用，程序会停...

isaacE2：二面是创始人级别的，而且每次必问两数之和

面试时最害怕被问到的问题

点赞评论收藏

分享

03-31 16:05

黑龙江大学 Java

在工作中，如何正确使用vibe coding来增效？

最近在工作里，大家都在讨论 vibe coding，工具也是百花齐放，cc，codex，trae。它确实提高了开发效率，但有时也会发现，明明生成的测试用例都通过了，但是交付后效果依然很差；变量名，项目结构完全没有按照规章来，太过发散；ai听不懂人话，需要多次返工，不仅没有增效，反而让leader觉得做事不仔细。也就是说，很多人只是用起来了，而不是用好了。真正把它用好，关键不在“让模型多写一点”，在于先想清楚边界。第一，先分清需要处理的是“项目”还是“模块”。如果只是一个边界清晰、输入输出明确的小模块，vibe coding 的效果通常很好，因为上下文相对稳定，模型更容易收敛到可用结果。但如果是...

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

16482次浏览 163人参与

# HR问：你期望的薪资是多少？如何回答 #

98847次浏览 829人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

46828次浏览 511人参与

# 如果春招能重来，我会___ #

17576次浏览 196人参与

# 一份好的简历长什么样？ #

41623次浏览 505人参与

# 除了线上，还能去哪些地方投简历 #

9935次浏览 109人参与

# 你觉得实习能学到东西吗 #

153682次浏览 1489人参与

# 滴！实习打卡 #

844367次浏览 6876人参与

# 秋招疯了，看什么都像offer #

65046次浏览 362人参与

# 面试官拷打AI项目都会问什么？ #

15156次浏览 484人参与

# 想做Agent可以做哪些岗位？ #

14594次浏览 440人参与

# 金三银四，你的春招进行到哪个阶段了？ #

36285次浏览 336人参与

# 你的公司给实习生发中秋礼物吗 #

17362次浏览 55人参与

# 26届秋招投递记录 #

124567次浏览 689人参与

# 九月了，是考研还是就业？ #

110084次浏览 610人参与

# 关于提前批我想问 #

307411次浏览 2381人参与

# 互联网公司评价 #

536231次浏览 4187人参与

# 反问环节如何提问 #

141616次浏览 2740人参与

# 秋招投简历越早越好吗 #

115855次浏览 855人参与

# 你实习是赚钱了还是亏钱了？ #

129281次浏览 723人参与

# 联想求职进展汇总 #

358427次浏览 2265人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务