昨天 11:33 门头沟学院 C++ 发布于北京

关注

Protobuf 的序列化和反序列化的细节

假设需要传递一个如下所示的messege

syntax = "proto3";

message MyMessage {
  int32 field1 = 1; // 值为1的int32字段
  string field2 = 2; // 值为"abc"的string字段
}

Protocol Buffers (Protobuf) 序列化和反序列化的细节

Protobuf 是一种高效的二进制序列化格式，它通过紧凑的编码方式来减少数据大小。以下是 Protobuf 序列化和反序列化的详细过程，包括长度压缩的机制。

1. Protobuf 的编码规则

Protobuf 使用一种称为 Varint 的编码方式来压缩整数类型，并根据字段类型选择不同的编码方式。以下是常见字段类型的编码规则：

Varint：用于 int32, int64, uint32, uint64, bool 等类型。
Length-delimited：用于 string, bytes, repeated 类型。
Fixed-length：用于 fixed32, fixed64, float, double 类型。

2. 序列化的过程

序列化是将消息对象转换为紧凑的二进制格式的过程。以下是序列化的详细步骤：

(1) 字段的编码

每个字段在序列化时由以下两部分组成：

字段标识符 (Key)：包含字段编号和字段类型。
字段值 (Value)：字段的实际数据。

字段标识符 (Key)

字段标识符是一个 Varint，包含以下信息：

字段编号 (Field Number)：在 .proto 文件中定义的字段编号。
字段类型 (Wire Type)：表示字段值的编码方式。

字段标识符的计算公式：

Key = (Field Number << 3) | Wire Type

0	Varint
1	64-bit 固定长度
2	Length-delimited
5	32-bit 固定长度

示例

假设字段编号为 1，字段类型为 Varint (Wire Type = 0)，则：

Key = (1 << 3) | 0 = 8

(2) 字段值的编码

字段值的编码方式取决于字段类型：

Varint 编码：整数类型使用 Varint 编码。
Length-delimited 编码：字符串和字节数组先编码长度，再编码内容。
Fixed-length 编码：浮点数和固定长度整数直接按固定字节数存储。

3. Varint 编码的细节

Varint 是一种变长整数编码方式，用于压缩整数。它的核心思想是：

每个字节的最高位（MSB）表示是否有后续字节。如果 MSB = 1，表示还有后续字节。如果 MSB = 0，表示这是最后一个字节。
剩余 7 位用于存储实际数据。

示例

整数 300 的二进制表示为 100101100，用 Varint 编码如下：

将二进制分成 7 位一组，从低位开始：100101100 → 00101100 和 00000010。
对每组添加 MSB：第一组：00101100 → 10101100（MSB = 1，表示有后续字节）。第二组：00000010 → 00000010（MSB = 0，表示这是最后一个字节）。
最终编码为：10101100 00000010。

4. Length-delimited 编码的细节

Length-delimited 类型（如字符串和字节数组）先编码长度，再编码内容：

长度：使用 Varint 编码表示内容的字节数。
内容：直接存储实际数据。

示例

字符串 "abc" 的编码：

字符串长度为 3，用 Varint 编码为 00000011。
字符串内容为 ASCII 编码：61 62 63。
最终编码为：03 61 62 63。

5. 反序列化的过程

反序列化是将二进制数据解析为消息对象的过程。以下是反序列化的详细步骤：

(1) 解析字段标识符

从二进制数据中读取 Varint，解析字段编号和字段类型：

字段编号：Key >> 3
字段类型：Key & 0x07

(2) 解析字段值

根据字段类型解析字段值：

Varint：逐字节读取，直到 MSB = 0。
Length-delimited：先读取长度（Varint 编码），再读取内容。
Fixed-length：直接读取固定字节数。

示例

假设接收到的二进制数据为：08 01 12 03 61 62 63，解析过程如下：

字段 1： Key = 08 → 字段编号 = 1，字段类型 = 0 (Varint)。值 = 01 → 解码为整数 1。
字段 2： Key = 12 → 字段编号 = 2，字段类型 = 2 (Length-delimited)。长度 = 03 → 内容长度为 3。内容 = 61 62 63 → 解码为字符串 "abc"。

最终解析结果：

{
  "field1": 1,
  "field2": "abc"
}

6. 长度压缩的优势

小整数压缩：Varint 对小整数非常高效。例如，0 到 127 只需 1 个字节。
跳过未识别字段：Length-delimited 类型的长度信息允许解析器快速跳过未知字段。
紧凑的二进制格式：相比 JSON 或 XML，Protobuf 消除了冗余的标签和空格。

总结

Protobuf 的序列化和反序列化通过 Varint 和 Length-delimited 编码实现了高效的压缩和解析。它的核心特点是：

使用 Varint 压缩整数，减少存储空间。
使用字段标识符和类型信息实现灵活的消息解析。
通过长度信息支持快速跳过未知字段。

这种机制使 Protobuf 成为一种高效、灵活的序列化格式，非常适合网络传输和存储。

全部评论

推荐最新楼层

05-07 21:13

已编辑

门头沟学院 C++

字节跳动-服务端开发实习生-游戏技术岗位一面2025.5.7

自我介绍你觉得你和别人比，优势在哪？C++的STL的map的底层是什么红黑树和平衡二叉树的区别和应用场景STL的哈希表的底层，扩容时是怎么操作的？（这我实在是没搞懂。扩容不是直接扩大桶数吗）HTTP协议在哪一层，GET和POST的区别TCP的4次挥手过程，3次行不行进程线程的区别图的广度、深度遍历是怎么遍历的讲一讲Linux的 I/O 复用技术代码：1）反转链表 （秒了） 2）螺旋矩阵打印（寄了）场景题目：万亿个int，怎么找前100个大的？反问

查看14道真题和解析

点赞评论收藏

分享

昨天 10:25

电子科技大学 C++

三面面试官能改吗？面试官家里有事给推到下周了

字节跳动三面462人在聊

点赞评论收藏

分享

04-13 17:02

莆田学院运营

薪资倒挂，怎么破解？

薪资倒挂这个问题是绝大多数公司都存在的，或者说99%的企业它都存在的。01. 倒挂的原因主要原因在于，企业内部需要保证薪酬的一个公平性，对外部需要保持一定的市场竞争力。比如同一家公司的同事，他们可能是同一个时间进来的，那他们的薪资涨幅大概都会保持正常的一个状态，就不会说因为这个人那个除非他能力特别强，我们给他额外加薪，或者说升职加的幅度会比较大。不然基本上来说，他都是内部会有一个固定的涨幅，比如说每年5%~10%左右，但是对外，假如说某一个行业或者某个岗位的人特别稀缺，那就公司必须要付出更多的钱才能招到对应的这样的一个人才，不然就竞争不过外面的企业，所以对外的来说他的薪酬的涨幅相对来说内部就会...

一觉醒来，秋招难度下降一万倍…… 牛客创作赏金赛

点赞评论收藏

分享

04-19 08:38

浙江大学 Java

求问苏州现在还有什么公司能投java开发暑期实习了吗

求问各位大佬各位学长苏州现在还有什么公司能投java开发暑期实习了吗

点赞评论收藏

分享

05-05 01:08

重庆理工大学行政经理

腾讯内推码腾讯面经

腾讯内推来啦~ 热乎乎的内推码：EUTPZZRV 腾讯倡导科技创新，为员工提供广泛的创新资源和项目支持，助您实现创新成就。 分享一些面经： 第一轮技术面 闭包作用及实际应用场景 HTTP/1.1、HTTP/2、HTTP/3的核心差异 实现红绿灯控制效果（异步时序逻辑） React Hooks的设计动机与类组件对比 浏览器事件代理原理及实际应用 手写Promise核心逻辑（包含resolve/reject） 数组去重与高频字符统计算法 Web安全防护措施（XSS、CSRF） 浏览器渲染流程与重排/重绘优化 跨域解决方案（JSONP、CORS、代理） 第二轮技术面 低代码平台技术难点与扩展...

腾讯HR面1989人在聊

点赞评论收藏

分享

评论

1

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 面试问题记录 #

8292次浏览 175人参与

# 异地恋该为对方跳槽吗 #

17380次浏览 100人参与

9192次浏览 70人参与

# 硬件人更看重稳定还是高薪 #

32734次浏览 184人参与

# 职场新人生存指南 #

319449次浏览 6761人参与

# 面试经验谈 #

7499次浏览 111人参与

# 签约/解约注意事项 #

654364次浏览 3999人参与

# 不考虑转正，实习多久合适 #

22695次浏览 116人参与

# 哪些公司校招卡第一学历 #

55845次浏览 211人参与

# 滴滴工作体验 #

21882次浏览 123人参与

# 硬件人你反向读研了吗 #

38534次浏览 608人参与

# 国央企笔面经互助 #

124920次浏览 1068人参与

# 租房找室友 #

24558次浏览 132人参与

# 得物求职进展汇总 #

91833次浏览 791人参与

# 你遇到过哪些神仙同事 #

68238次浏览 623人参与

# 机械人选offer，最看重什么？ #

89001次浏览 541人参与

# 哪些公司面试官让你印象深刻？ #

259763次浏览 2734人参与

# 材料进Fab厂真的劝退吗？ #

34961次浏览 158人参与

# 机械求职避坑tips #

39946次浏览 353人参与

# 学历or实习经历，哪个更重要 #

110333次浏览 741人参与

# 硬件人秋招的第一个offer #

64347次浏览 1079人参与

牛客网
牛客企业服务