01-14 10:59 北京理工大学发布于浙江

关注

向量动态量化

本文介绍向量检索服务DashVector动态量化功能和作用。

背景介绍

量化（Quantization）是向量检索技术中一种常用的优化方法，通过一定程度的精度（召回率）损失，来换取性能的大幅度提升，以及内存占用（索引文件大小）大幅度降低。

向量检索服务DashVector支持向量的动态量化，用户仅需在新建Collection时选择对应的量化策略，即可无感的使用量化功能。

开启动态量化

前提条件

已创建Cluster
已获得API-KEY
已安装最新版SDK

代码示例

说明

需要使用您的api-key替换示例中的YOUR_API_KEY、您的Cluster Endpoint替换示例中的YOUR_CLUSTER_ENDPOINT，代码才能正常运行。
Cluster Endpoint，可在控制台"Cluster详情"中查看。

import dashvector
import numpy as np
from dashvector import VectorParam

client = dashvector.Client(
    api_key='YOUR_API_KEY',
    endpoint='YOUR_CLUSTER_ENDPOINT'
)
assert client

# 创建带有量化策略的collection
ret = client.create('quantize_demo', 
                     vectors=VectorParam(768, quantize_type='DT_VECTOR_INT8'))
print(ret)

collection = client.get('quantize_demo')

# 正常写入向量数据，该向量数据会按照创建collection时定义的量化策略自动进行量化
collection.insert(('1', np.random.rand(768).astype('float32')))

# 通过id获取对应的doc，需注意，这里获取到的向量数据是经过反量化后的近似值，非插入时的原值
doc = collection.fetch('1')

# 若检索时设置返回向量数据，返回的向量数据同样是经过反量化后的近似值，非插入时的原值
docs = collection.query(
    vector=np.random.rand(768).astype('float32'),
    include_vector=True
)

说明

通过获取Doc获取到的向量数据，是经过反量化后的近似值，非插入时的原值。

参数描述

创建Collection时可通过VectorParam类的quantize_type字段来定义量化策略。quantize_type当前可选值如下：

DT_VECTOR_INT8：将Float32向量量化为INT8类型

性能和召回率参考

基于1百万768维数据集

DashVector规格：P.large
度量方式：cosine
topk ：100

说明

可以看到这个示例中，以4.38%的召回率下降为代价，将索引大小缩减为原来的1/3，同时QPS提升了48%。
以上数据为基于Cohere数据集实测结果，但不同数据集的数据分布对QPS、召回以及压缩比有影响，上述数据仅供参考。

更多参考

可以看到，DashVector量化策略并非适用于所有数据集。在实际生产环境中，请谨慎使用量化策略。

建议创建不带量化策略、带量化策略的两个Collection，经过实际对比、测试、验证后再确定是否可将量化策略用于生产环境。

DashVector 文章被收录于专栏

DashVector向量检索服务

全部评论

推荐最新楼层

长沙学院 Java

实践是检验真理的唯一标准，所以的实践才知道可不可用

点赞回复分享

发布于 01-18 19:04 云南

01-16 14:10

清华大学 Java

被别人说是做题家，我觉得这是别人的一种“酸”

有人说我是“做题家”，我倒觉得这更多是一种“酸”。能把题做好，本身就是能力的一部分，说明肯下功夫、能坚持、愿意花时间钻研。做题不是目的，而是过程。通过做题，我学会了思考问题、拆解问题，也积累了基础和自信。与其嘲讽别人努力，不如承认努力本身就值得尊重。如果认真学习、踏实进步都要被贴标签，那我宁愿当一个一直向前的“做题家”。

被说“做题家”，你的反应...

点赞评论收藏

分享

2025-12-28 10:55

天津大学产品经理

不知道走什么方向了，想备战春招，投实习也颗粒无收，大佬们求指点，轻喷，本科摆了。

实习要如何选择和准备？

点赞评论收藏

分享

01-14 14:34

已编辑

华北电力大学客户端开发

应届生入职半年，分享7个让我不再内耗的职场经验！

刚进职场那会儿，我每天都在反思：是不是我太菜了？是不是领导不喜欢我？是不是我不适合工作？后来慢慢发现，很多内耗其实是没必要的。下面这6点，是我踩坑后总结出来的，可能对26届即将入职的朋友有点用。1.别只看领导做了什么，要想他为什么这么做 被领导批评≠你不行。有一句话说的好，不扣钱的批评你别信，不加钱的夸奖你别听。很多时候领导的批评也是他管理的手段，他要给他上面的领导交差罢了👉 职场里很多行为，本质是向上交差，不一定和你本人有关。2.不接住别人的情绪只解决事情有次客户找我私下帮忙，但公司明确不允许，对方急得在电话里喷我。我等他说完，只说了一句：“我理解你着急，但这件事我确实无能为力。”后来他反...

工作压力大，你会干什么？

点赞评论收藏

分享

01-01 08:45

慧策（掌上先机）_后端开发工程师

TCL java开发实习生面经

12.9 TCL java开发实习生以下是面试中面试官提出的问题总结：1. 项目细节比亚迪实习项目：“你这里的项目能不能挑一个你主要负责的讲一下？”（用户回答身份认证、测试环境连接器二次开发、时间转换器）“具体问题是什么？比如时间转换的业务逻辑？”北京掌上新机网络项目：“这个项目里处理过并发相关的，具体问题是什么？”（用户回答数据量太大导致传输失败，采用分片传输和校验）“线程池的核心参数（最大线程数、队列容量）有哪些？在项目中如何设置？”2. 技术深度提问Redis缓存：“Redis是什么？它的特点是什么？如何减少SQL压力？”Java集合：“你用双端队列处理卖家信任度排序的业务场景，具体是怎样的？”“还有哪些数据结构？各自的特点是什么？”（用户回答哈希结构等）分库分表：“比亚迪的分库分表场景是什么？为什么要分库分表？”“分库分表的类型（水平/垂直）有什么区别？”“分库分表后会有什么问题？查询效率如何体现？”JVM垃圾回收：“JVM有哪些垃圾回收算法？（标记、复制、标记整理、分代收集）”“实际项目中如何选择垃圾回收器？”3. 校园经历与能力组织活动：“你在学校组织过哪些活动？”（用户回答团日活动、党员工作站工作、足球比赛）“如何保障任务进度？举个例子说明。”（用户以红色文化活动为例，讲分工、安全、材料整理等）4. 候选人反问“你们部门的业务方向是什么？”（面试官回答研发效能、数据处理等）“团队的人员架构和工作内容是怎样的？”“后续的面试流程大概是怎样的？”总结面试官的问题主要围绕项目细节、技术深度（Redis、集合、分库分表、JVM垃圾回收）、校园经历与组织能力展开，并在最后询问了部门方向、人员架构和后续流程，体现了对候选人技术能力和岗位匹配度的关注。

查看14道真题和解析

点赞评论收藏

分享

01-16 23:40

科大讯飞_教育BG_后端开发(准入职员工)

被说“做题家”，我的反应是虚心接受

先想把 “小镇做题家” 的定义理解清楚：出身小城镇，靠着一路题海战术闯过高考，敲开 985、211 这些名校的大门；可进了大学、踏入社会，又会真切感受到自己的视野不够宽、手里的资源没那么多，综合能力也和城市里长大的同龄人有差距。我倒觉得，这份差距是客观存在的，没必要自我怀疑，更犯不上陷在焦虑里打转 —— 毕竟纠结这些，从来都解决不了任何问题。我们得好好正视这个身份，正视这份成长里的落差。对我们这些普通人来说，高考哪是什么 “独木桥”，分明是相对最公平、性价比也最高的一条路。它不问你出身在哪，不问你家里有什么资源，只看你笔下的那支笔、卷子上的那些字。所以高考结束前，踏踏实实做个 “小镇做题家”，...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 除了Java，最推荐学什么技术？ #

1697次浏览 55人参与

# AI时代的工作 VS 传统时代的工作，有哪些不同？ #

2061次浏览 71人参与

# 你的landing期是如何度过的？ #

2115次浏览 42人参与

# 滴滴求职进展汇总 #

299034次浏览 2445人参与

# 秋招报数：你投了多少家公司？ #

148333次浏览 946人参与

# 机械制造面试点评 #

83995次浏览 471人参与

# 你觉得早上几点上班合适？ #

94304次浏览 353人参与

# 机械人与华为的爱恨情仇 #

147197次浏览 1030人参与

# 机械只有转码才有出路吗？ #

159389次浏览 1653人参与

# 我和mentor的爱恨情仇 #

102870次浏览 925人参与

# 你觉得mentor喜欢什么样的实习生 #

45505次浏览 989人参与

# 如何提高实习转正率？ #

80871次浏览 488人参与

# 实习期间如何提升留用概率？ #

231064次浏览 1788人参与

# 你觉得什么岗位会被AI替代 #

35292次浏览 236人参与

# 聊聊你的被动加班经历 #

8492次浏览 101人参与

# 秋招提前批，你开始投了吗 #

705801次浏览 8437人参与

# 面试常问题系列 #

268797次浏览 4687人参与

# 京东求职进展汇总 #

1138615次浏览 8519人参与

# 牛客十周岁生日快乐 #

207830次浏览 1937人参与

# 为了秋招你都做了哪些准备？ #

31495次浏览 532人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务