Protobuf 通信协议

Protobuf

  • Protobuf 简介
  • 使用
  • 技术内幕

Protobuf 简介

在移动互联网时代,手机流量、电量是最为有限的资源,而移动端的即时通讯应用无疑必须得直面这两点

解决流量过大的基本方法就是使用高度压缩的通信协议,而数据压缩后流量减小带来的自然结果也就是省电:因为大数据量的传输必然需要更久的网络操作、数据序列化及反序列化操作,这些都是电量消耗过快的根源

当前即时通讯应用中最热门的通信协议无疑就是 Google 的 Protobuf 了。它和 xml、json 类似,定义了数据结构的存储格式,并且为 C++、java 等数十种语言提供了对应的 api,让该通信协议可以在不同语言的项目中相互通信

使用

Protobuf 的语法非常类似 c 语言,下面是一个例子。首先我们需要编写一个 proto 文件,定义我们程序中需要处理的结构化数据,在 protobuf 的术语中,结构化数据被称为 Message

package lm;
message helloworld
{required int32     id = 1;  // IDrequired string    str = 2;  // stroptional int32     opt = 3;  //optional field
}

写好 proto 文件之后就可以用 Protobuf 编译器将该文件编译成目标语言了。我们可以使用 maven 的 install 功能直接将 proto 文件编译为 java 语言,这次我们选择将该文件编译为 c++

protoc -I=$SRC_DIR --cpp_out=$DST_DIR $SRC_DIR/addressbook.proto

命令将生成两个文件:

  • lm.helloworld.pb.h , 定义了 C++ 类的头文件
  • http://lm.helloworld.pb.cc , C++ 类的实现文件

在生成的头文件中,定义了一个 C++ 类 helloworld,一般来说我们还需要添加诸如对消息的成员进行赋值,将消息序列化等等都有相应的方法

Protobuf 的主要优点就是:简单,快。这有测试为证,项目 thrift-protobuf-compare 比较了这些类似的技术,显示了该项目的一项测试结果
请添加图片描述

技术内幕

有两项技术保证了采用 Protobuf 的程序能获得相对于 XML 极大的性能提高:

  • Protobuf 封解包的过程比 XML 更加优秀
  • 我们可以考察 Protobuf 序列化后的信息内容。Protocol Buffer 信息的表示非常紧凑,这意味着消息的体积减少,自然需要更少的资源。比如网络上传输的字节数更少,需要的 IO 更少等,从而提高性能

首先我们来了解一下 XML 的封解包过程。XML 需要从文件中读取出字符串,再转换为 XML 文档对象结构模型。之后,再从 XML 文档对象结构模型中读取指定节点的字符串,最后再将这个字符串转换成指定类型的变量。这个过程非常复杂,其中将 XML 文件转换为文档对象结构模型的过程通常需要完成词法文法分析等大量消耗 CPU 的复杂计算

反观 Protobuf,它只需要简单地将一个二进制序列,按照指定的格式读取到 C++ 对应的结构类型中就可以了。从上一节的描述可以看到消息的 decoding 过程也可以通过几个位移操作组成的表达式计算即可完成。速度非常快

第二点,Protobuf 序列化后所生成的二进制消息非常紧凑,这得益于 Protobuf 采用的非常巧妙的 Encoding 方法比如对于 int32 类型的数字,一般需要 4 个 byte 来表示。但是采用 Varint,对于很小的 int32 类型的数字,则可以用 1 个 byte 来表示。当然凡事都有好的也有不好的一面,采用 Varint 表示法,大的数字则需要 5 个 byte 来表示。从统计的角度来说,一般不会所有的消息中的数字都是大数,因此大多数情况下,采用 Varint 后,可以用更少的字节数来表示数字信息

Varint 中的每个 byte 的最高位 bit 有特殊的含义,如果该位为 1,表示后续的 byte 也是该数字的一部分,如果该位为 0,则结束。其他的 7 个 bit 都用来表示数字。因此小于 128 的数字都可以用一个 byte 表示。大于 128 的数字,比如 300,会用两个字节来表示:1010 1100 0000 0010。下图演示了 Google Protocol Buffer 如何解析两个 bytes。注意到最终计算前将两个 byte 的位置相互交换过一次,这是因为 Google Protocol Buffer 字节序采用 little-endian 的方式

消息经过序列化后会成为一个二进制数据流,该流中的数据为一系列的 Key-Value 对

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/830594.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Stable Diffusion常用提示词(Prompt)

视图相关提示词 正面视角:from front, front view俯视角度:from above, high angle, birds-eye view顶视图:top view仰视角度:from below, low angle, upward view背后角度:from behind侧面视角:from the side, side view, lateral view多视图:multiple views超广角:ul…

PyCharm更换pip源、模块安装、PyCharm依赖包导入导出

一、Pycharm更换安装源 在下载安装好Pycharm后,一个在实际编程开发过程中非常重要的问题是第三方库添加,然而Python默认的源网络速度有点慢,因此,我们常常需要做的是更换Pycharm的安装源。 在当前最新版(2022.03版&…

C++三大特性及应用

C三大特性 面向对象程序设计(OOP)是一种编程范式,它使用“对象”来设计软件。在OOP中,对象是类的实例,类包含数据(属性)和可以对数据执行操作的方法(行为)。 面向对象的…

jupyter notebook设置代码自动补全

jupyter notebook设置代码自动补全 Anaconda Prompt窗口执行 pip install jupyter_contrib_nbextensionsjupyter contrib nbextensions install --userpip install jupyter_nbextensions_configuratorjupyter nbextensions_configurator enable --user按如下图片设置 卸载jed…

线上剧本杀小程序:创新玩法下带来的市场活力

近几年来,剧本杀作为一种新型的游戏娱乐模式,深受年轻人的喜欢,成为了当下年轻人娱乐休闲的主要方式之一。剧本杀行业在经历过一段时间的“野蛮生长”后,游戏内容和服务得到的升级发展,游戏的趣味性和体验感也逐渐增强…

C#基础之冒泡排序

排序初探 文章目录 冒泡排序1、概念2、冒泡排序的基本原理3、代码实现思考1 随机数冒泡排序思考2 函数实现排序 冒泡排序 1、概念 将一组无序的记录序列调整为有序的记录序列(升、降序) 2、冒泡排序的基本原理 两两相邻,不停比较&#x…

Ieetcode——21.合并两个有序链表

21. 合并两个有序链表 - 力扣(LeetCode) 合并两个有序链表我们的思路是创建一个新链表,然后遍历已知的两个有序链表,并比较其节点的val值,将小的尾插到新链表中,然后继续遍历,直到将该两个链表…

C++笔记之memcpy探究

C++笔记之memcpy探究 code review! 文章目录 C++笔记之memcpy探究1.memcpy()2.memcpy拷贝结构体2.1.最基础版本——打印出来的userdata_ptr是16进制形式2.2.reinterpret_cast——打印出来的userdata_ptr是可读形式2.3.上一版本继续优化2.4.上一版本继续优化,使用"placem…

【C++之deque和priority_queue的应用】

C学习笔记---015 C之deque和priority_queue的应用1、deque的简单介绍2、deque的简单接口应用3、deque的模拟实现4、priority_queue的简单介绍5、priority_queue的应用6、priority_queue的模拟实现7、小结 C之deque和priority_queue的应用 前言: 前面篇章学习了C对于…

【STM32】F4使用通用定时器输出可变PWM方法

网上的文章太啰嗦,这里直接开始。 使用的是STM32CubeIDE,HAL。以通用定时器TIM12在 通道2上输出1KHz的PWM为例。 要确定输出的引脚、定时器连接在哪里。 TIM2、3、4、5、12、13、14在APB1上,最大计数频率84M。 TIM1、8、9、10、11在APB2…

vue3【实用教程】声明响应式状态(含ref,reactive,toRef(),toRefs() 等)

Vue 3 中的数据基于 JavaScript Proxy (代理) 实现响应式 ( vue2 中的数据通过 Object.defineProperty() 方法和对数组变异方法的重写,实现响应式) 选项式 API 用 data 选项声明响应式状态,值为返回一个对象的函数。 在创建组件实例的时候会调用此函数函…

使用groovy+spock优雅的进行单测

使用groovyspock优雅的进行单测 1. groovyspock示例1.1 简单示例1.2 增加where块的示例1.3 实际应用的示例 2. 单测相关问题2.1 与SpringBoot融合2.2 单测数据与测试数据隔离2.3 SQL自动转换(MySQL -> H2) 参考 Groovy是一种基于JVM的动态语言&#x…

linuxwindowns文件共享之samba

samba 我们所了解过的 FTP 文件传输,的确可以让不同主机之间进行文件传输,此方式特点是,传输文件,用户想要在客户端直接修改服务器的数据,还是较为麻烦。 既然如此,linux 上有一款应用叫 Samba&#xff0…

Java的逻辑控制和方法的使用介绍

前言 程序的逻辑结构一共有三种:顺序结构、分支结构和循环结构。顺序结构就是按代码的顺序来执行相应的指令。这里主要讲述Java的分支结构和循环结构,由于和C语言是有相似性的,所以这里只会提及不同点和注意要点~~ 注意在C语言中,…

日本软文发稿:成功的关键与应注意之事项

在当今的营销环境中,产品和服务如何被消费者所知,和品牌如何被市场所接受,软文发稿扮演了极其重要的角色。对于希望在日本市场拓展业务的企业来说,了解和熟悉日本的软文发稿尤其关键。 一,优秀的媒体平台 日本拥有众…

docker hub 官网

1. docker官网: Docker: Accelerated Container Application Development 2. hub官网: https://hub.docker.com/search?qnexus 有时候不好找,或者忘了,特此标记!

「玻尔曾孙」领衔!超辐射原子,重塑全球精准测时——

超辐射原子能够帮助我们以前所未有的精度测量时间。在哥本哈根大学最近的一项研究中,研究人员开发了一种新的测量时间间隔(秒)的方法,这种方法克服了目前最先进原子钟面临的一些限制。 这一成就有望在多个领域产生深远影响&#x…

AI智能体的未来:引领科技创新潮流

Agent AI智能体的未来 随着Agent AI智能体的智能化水平不断提高,它们在未来社会中的角色、发展路径以及可能带来的挑战也引起了广泛关注。快来分享一下你的看法吧~ 技术进步与创新 随着科技的发展,新的产业和商业模式不断涌现,创造了新的收…

代码随想录Day 36|Python|Leetcode|01背包问题,你该了解这些! ● 01背包问题,你该了解这些! 滚动数组 ● 416. 分割等和子集

01背包问题,你该了解这些! 46. 携带研究材料(第六期模拟笔试) (kamacoder.com) 代码随想录 (programmercarl.com) 确定dp数组(dp table)以及下标的含义:dp[i][j] 表示从下标为[0-i]的物品里…

JAVA 每日面试题(二)

Java 高级面试问题及答案 1. 什么是Java内存模型(JMM)?它在多线程编程中扮演什么角色? 答案: Java内存模型(JMM)是一个抽象的概念,它定义了Java程序在执行时,变量的访问…