算法打工人小旺

08-02 22:19 中山大学算法工程师发布于山东

关注

Qwen3 Embedding 与 BGE 有什么区别？

🌟Encoder 架构的词嵌入模型
数据格式：[ CLS ]句子 A [ SEP ]句子 B [ SEP ]并行计算：同时感知上下文，计算速度快向量表示： Encoder 会在输入的最前面加一个特殊的[ CLS ]标记。在经过计算后使得[ CLS ］标记向量能够代表整句话的含义
Qwen3 Embedding 基于Qwen3模型，嵌入模型将单个文本段作为输入，用［ EOS ]标记所对应的向量代表整句话的向量。
Qwen3 Embedding 的训练过程
1.使用大合成数据进行弱监督学习利用Qwen3基座模型直接合成数据，而 BGE 与E5等模型都是从开源社区收集数据。
2.利用高质量合成数据进行 SFT 对筛选出的高质量合成数据和公开监督数据集进行监督训练。
3.模型合并
将微调过程中的多个模型检查点保存，采用 slerp 技术进行模型融合，增加泛化能力。
🌟Qwen3 Embedding 的数据合成
Qwen3 Embedding 模型加入信息检索、比对挖掘、分类和文本相似度四类合成数据。
以信息检索为例
1.输入：多语种文档＋候选角色
Qwen3-32B决策：选择最可能对文档感兴趣的角色、问题类型与难度（高中／大学的知识）
2.构造检索对：输入上一阶段的文档与角色，对问题类型、难度进行限制。从角色视角出发，按需求生成文档对应的自然语言查询。
🌟Qwen3 Embedding 的新用法
Qwen3 Embedding 模型的 query 前能加一个 prompt ，这个 prompt 会与 query 一起向量化。
那么我们就可以在向量化 query 前加一个 prompt :寻找写作风格相似的其他文档。
🌟总结🍊
1．训练数据不同。以前词嵌入模型采用公开数据，现在的训练数据会使用大模型加工合成，更精细可控，站在了巨人的肩膀上。
2．模型结构不同。在生成式大模型采用 Decoder 架构后，词嵌入模型也借鉴了 Decoder ，使用[ EOS ]标签对应的向量来表示句子向量。
3．训练方法改进。 Encoder 架构的训练方式是 Mask 猜词与相似度计算。而Qwen3词嵌入模型采用多阶段训练与合并结果，让模型效果更上一层楼。
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

08-06 15:00

阿里巴巴_算法工程师

AI Compass前沿速览：Qwen3-Coder、Ollama 桌面版、Kimi K2高速版

AI Compass前沿速览：Qwen3-Coder、Ollama 桌面版、Kimi K2高速版、FLUX.1 Krea [dev]文生图、小星绪漫画生成、氢离子医学AI助手 AI-Compass 致力于构建最全面、最实用、最前沿的AI技术学习和实践生态，通过六大核心模块的系统化组织，为不同层次的学习者和开发者提供从完整学习路径。  github地址：AI-Compass👈：******************************************** gitee地址：AI-Compass👈：******************************************* ...

被AI治愈的瞬间

点赞评论收藏

分享

08-06 12:29

中山大学算法工程师

淘天多模态大模型面经

✅一面 1．首先是自我介绍和过项目，面试官还一起探讨项目用到的方法，可行性之类的2．介绍一下 CLIP3．了解 LoRA 吗， LoRA 微调的原理是什么4．了解哪些多模态大模型，简要介绍几个5.BLIP的三个损失函数分别是什么，数据是怎样清洗的6.BLIP2相对于 BLIP 有哪些改进，BLIP3又有哪些改进7.Qwen- VL 的三个训练流程分别是什么，有什么作用8．视觉编码器和 LLM 连接时，使用BLIP2中 Q - Former 那种复杂的 Adaptor 好还是 LLaVA 中简单的 MLP 好，说说各自的优缺点9．代码：实现多头自注意力一面比较常规，几乎都是八股问题，我觉得只要了解常见的多模态大模型都问题不大，主要还是要理解各个模型设计的动机是什么，这也是面试最喜欢考察的✅二面1．自我介绍和过项目，简要问了项目中使用某些方法的动机，以及是否会导致其他的问题2．了解 Transformer 吗，编码器和解码器的注意力有什么区别，在计算注意力中时除以 dk \ sqrt { d _ k }\ sqrt [ d _ k ｝的原因是什么3．后来有哪些比较经典的基于 Transformer 的语言模型， Qwen 相比于原始 Transformer 有哪些结构上的改动，Qwen2又有哪些改进4．了解 RLHF 吗， DPO 和 PPO 有什么区别， Loss 是什么样的，各自的优缺点是什么5．介绍一下 CLIP ，还了解什么其他的对比学习方法6．开放题：了解哪些多模态大模型，目前多模态大模型最的问题是什么7．代码：1143．最长公共子序列二面其实也偏常规，几乎也都是八股问题，但是也考察了一些对模型的理解以及知识面的广度，整体来说比一面的难度大一些✅三面：1．自我介绍，然后详细过了一下项目2．了解哪些大模型和多模态大模型，然后就聊了大模型这一路是怎么发展过来的，Transformer 、 BERT 、 GPT 、 LLaMA 、 Qwen ix ,以及当时的o1推理模型3．平常有尝试过训练过大模型吗，规模小一点的也没关系4．聊天，包括职业规划等等三面比较轻松，面试官说知识点前面两面都考察过了，三面就轻松一些，大概40来分钟吧📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

点赞评论收藏

分享

08-06 15:06

中电金信：破题异构算力调度，中电金信助力AI大模型高效推理

7月25日至27日，以“算力网：新质生产力背景下的分布式系统”为主题的第二届CCF分布式计算大会暨中国算力网大会（CCF Computility 2025）在兰州召开。本次大会吸引了来自学术界与产业界的1200余位专家学者、行业代表齐聚一堂，共探分布式计算与算力网络的前沿技术与发展前景。大会期间，中电金信研究院容器云技术实验室主任王磊就“异构资源调度与流量治理在大模型推理中的应用”进行了成果分享。在AI大模型加速落地的背景下，高效管理异构算力资源并实现高效推理已成为产业关注的核心议题。王磊认为，随着人工智能进入大模型时代，智能算力需求呈现爆发式增长，算力产业规模随之飞速扩张。然而，算力资源高度...

点赞评论收藏

分享

08-05 23:17

北京邮电大学产品经理

美团校招产品岗位解读

万众期待的美团校招正式开启了～美团校招开启啦，北上广深、成都、香港、利雅德、巴西圣保罗，数十个城市我有很多同事现在正在美团的各个岗位工作，我也第一时间联系到他们，为各位有意投递美团产品的同学带来最新消息投递策略建议①秋招可投三个志愿，增加面试机会 ②志愿不必一次全部填写，可以先投一个 ③最心仪的志愿优先填报，早日投递可获得2次笔试机会关于小伙伴关心的问题Q：为什么只有一个产品岗位？A：校招产品只有一个，说明这场面试是通用能力考察，目的是筛选出综合能力更有潜力的同学。在面试环节中，面试官遇到很有潜力的同学，也会跟hr打招呼，未来面试结束进入到抢人环节，二面面试官所在的事业部极有可能就是未来你的首...

投递美团等公司10个岗位

点赞评论收藏

分享

07-23 22:54

门头沟学院数据分析师

大数据面试2小时前冲刺必备：大厂高频大数据面经【下】（数据分析挖掘篇-多张原理图）

数据仓库的概念及与数据库的区别是什么？（shein、大厂八股文、soul）数据仓库（Data Warehouse）是为支持决策分析而设计的面向主题（Subject-Oriented）、集成的（Integrated）、相对稳定的（Non-Volatile）、反映历史变化（Time-Variant）的数据集合。其主要目的是通过对大量历史数据的整理、整合、清洗和建模，为业务管理层、数据分析师等提供准确、全面、及时的决策支持。与传统数据库系统相比，数据仓库与数据库在多个方面存在本质差异：主要用途面向事务处理，如增删改查面向分析处理，如报表、统计、趋势分析等数据特征当前数据，实时性强历史数据，为分析提供...

大数据从入门到精通-最全...

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的秋招“寄”录 #

23562次浏览 273人参与

# 如果校招重来我最想改变的是 #

276044次浏览 2863人参与

# 去哪儿旅行秋招 #

245494次浏览 3193人参与

# 给26届的秋招建议 #

8962次浏览 344人参与

# CVTE求职进展汇总 #

17675次浏览 295人参与

# 实习的内耗时刻 #

23973次浏览 331人参与

# 腾讯大前端岗位热招中 #

16024次浏览 180人参与

# 你上一次给父母打电话是什么时候 #

8626次浏览 90人参与

# 独居后，你的生活是更好了还是更差了？ #

8003次浏览 127人参与

# 规定下班时间vs实际下班时间 #

14192次浏览 121人参与

# 工作上你捅过哪些篓子？ #

11455次浏览 85人参与

# 秋招，不懂就问 #

5291次浏览 37人参与

# 你最近一次加班是什么时候？ #

74663次浏览 396人参与

# 安利/避雷我的专业 #

80590次浏览 531人参与

# 入职第四天，心情怎么样 #

33858次浏览 443人参与

# 大城市找工作会更容易吗 #

44072次浏览 352人参与

# 我的AI电子员工 #

10795次浏览 80人参与

# 你觉得找工作该拿大厂还是小厂练手 #

200150次浏览 1760人参与

# 速腾聚创求职进展汇总 #

34336次浏览 240人参与

# 秋招想进国企该如何准备 #

81833次浏览 444人参与

# 得物求职进展汇总 #

103969次浏览 833人参与

# 我的国央企投递进展 #

51132次浏览 308人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务