大白话解析LevelDB: Block Iterator

文章目录

  • Block Iterator
    • Iterator 接口
    • Block Iterator 的实现
      • Block Iterator 的私有成员
      • Block Iterator 的构造函数
      • Block::Iter::Valid()
      • Block::Iter::status()
      • Block::Iter::key()
      • Block::Iter::value()
      • Block::Iter::Next()
      • Block::Iter::Prev()
      • Block::Iter::Seek(const Slice& target)
      • Block::Iter::SeekToFist()
      • Block::Iter::SeekToLast()

Block Iterator

Block Iterator用于遍历一个SST中的某个BlockBlock的结构如下:

+----------------+
|    Key1:Value1 |
+----------------+
|    Key2:Value2 |
+----------------+
|       ...      |
+----------------+
|    KeyN:ValueN |
+----------------+
| Restart Point1 |
+----------------+
| Restart Point2 |
+----------------+
|       ...      |
+----------------+
| Restart PointM |
+----------------+
| Num of Restarts|
+----------------+

关于Block的结构详情可移步参考(大白话解析LevelDB: BlockBuilder)[https://blog.csdn.net/sinat_38293503/article/details/134997464#Block__153]。

Iterator 接口

Block::IterIterator接口的一种实现,所以我们先看下Iterator里都有哪些接口需要实现:

class LEVELDB_EXPORT Iterator {public:Iterator();Iterator(const Iterator&) = delete;Iterator& operator=(const Iterator&) = delete;virtual ~Iterator();// 判断迭代器当前所在位置是否有效,如果有效,// 则可以通过 key() 和 value() 获取当前键值对。virtual bool Valid() const = 0;// 将当前位置移动到第一个 Key-Value 所在处。virtual void SeekToFirst() = 0;// 将当前位置移动到最后的 Key-Value 所在处。virtual void SeekToLast() = 0;// 将当前位置移动到第一个大于等于 target 的 Key-Value 所在处。virtual void Seek(const Slice& target) = 0;// 将当前位置移动到下一个 Key-Value 所在处。virtual void Next() = 0;// 将当前位置移动到上一个 Key-Value 所在处。virtual void Prev() = 0;// 返回当前位置的 Key。virtual Slice key() const = 0;// 返回当前位置的 Value。virtual Slice value() const = 0;// 返回迭代器的当前状态。// 如果状态不是 ok,则说明迭代器已经失效,不可使用了。virtual Status status() const = 0;// 用户可注册多个 CleanupFunction,当迭代器被销毁时,会按顺序调用这些 // CleanupFunction。// 需要注意的是,RegisterCleanup 这个方法不需要 Iterator 的子类实现,// Iterator 已经实现了,用户不需要重写。using CleanupFunction = void (*)(void* arg1, void* arg2);void RegisterCleanup(CleanupFunction function, void* arg1, void* arg2);
};

Block Iterator 的实现

Block::IterIterator接口的一种实现,它需要实现Iterator接口里的所有抽象方法。

Block Iterator 的私有成员

在阅读Block Iterator的实现之前,我们先来看一下Block Iterator里各个私有成员的含义,为后续的阅读做好准备。

class Block::Iter : public Iterator {private:// 构造 Iter 的时候传入一个 Comparator,决定了 Block 中的 key 的排序方式const Comparator* const comparator_;// data_ 指向存放 Block 数据的地方const char* const data_;       // underlying block contents// 通过 data_ + restarts_ 可得到重启点数组的起始位置uint32_t const restarts_;      // Offset of restart array (list of fixed32)// 重启点的数量uint32_t const num_restarts_;  // Number of uint32_t entries in restart array// current_ is offset in data_ of current entry.  >= restarts_ if !Valid//// 当前 Key-Value 在 data_ 中的偏移量uint32_t current_;// 当前处在哪个重启点,通过 restarts_[restart_index_] 可拿到当前重启点uint32_t restart_index_;  // Index of restart block in which current_ falls// 当前 Key-Value 中的 keystd::string key_;// 当前 Key-Value 中的 valueSlice value_;// 当前 Iterator 的状态Status status_;
}

Block Iterator 的构造函数

SST中解析出一个Block的以下 3 个信息后,就可以构造一个Block Iterator了:

  • data指针
  • 重启点数组在data中的偏移量
  • 重启点的数量
Iter(const Comparator* comparator, const char* data, uint32_t restarts, uint32_t num_restarts): comparator_(comparator),data_(data),restarts_(restarts),num_restarts_(num_restarts),current_(restarts_),restart_index_(num_restarts_) {assert(num_restarts_ > 0);
}

Block::Iter::Valid()

current_表示当前Key-Valuedata_中的偏移量,restarts_表示重启点数组在data_中的偏移量,所以current_小于restarts_时,Block::Iter是有效的。

如果current_大于等于restarts_current_就已经指向重启点的区域了,此时Block::Iter是无效的。

bool Valid() const override { return current_ < restarts_; }

Block::Iter::status()

没啥好说的,直接返回当前Iterator的状态。

Status status() const override { return status_; }

Block::Iter::key()

Prev(), Next(), Seek()方法会将current_指向一个有效的Key-Value,并且将该Key-Valuekeyvalue分别存储到key_value_中,所以key()方法直接返回key_即可。

Slice key() const override {assert(Valid());return key_;
}

Block::Iter::value()

Prev(), Next(), Seek()方法会将current_指向一个有效的Key-Value,并且将该Key-Valuekeyvalue分别存储到key_value_中,所以key()方法直接返回key_即可。

Slice value() const override {assert(Valid());return value_;
}

Block::Iter::Next()

将迭代器移动到下个Key-Value的位置。

void Next() override {assert(Valid());// 将 current_ 移动到下一个 Key-Value 的位置,// 并且解析出 Key。ParseNextKey();
}

Next()的实现逻辑都甩给了ParseNextKey().

ParseNextKey()的实现如下:

bool ParseNextKey() {// 计算下一个 Key-Value 的偏移量current_ = NextEntryOffset();// 找到下一个 Key-Value 的首地址const char* p = data_ + current_;// limit 指向重启点数组的首地址const char* limit = data_ + restarts_;  // Restarts come right after data// 如果当前 Key-Value 的偏移量超过了重启点数组的首地址,// 表示已经没有 Next Key 了。if (p >= limit) {current_ = restarts_;restart_index_ = num_restarts_;return false;}// 根据重启点来解析下一个 Key-Valueuint32_t shared, non_shared, value_length;p = DecodeEntry(p, limit, &shared, &non_shared, &value_length);if (p == nullptr || key_.size() < shared) {// 解析失败,将错误记录到 Iterator 的 status_ 里。CorruptionError();return false;} else {// 解析成功,此时 p 指向了 Key 的 non_shared 部分,// 将 shared 和 non_shared 部分拼接起来,得到当前 Key。key_.resize(shared);key_.append(p, non_shared);value_ = Slice(p + non_shared, value_length);// 更新 restart_index_,找到下一个重启点while (restart_index_ + 1 < num_restarts_ &&GetRestartPoint(restart_index_ + 1) < current_) {++restart_index_;}return true;}
}

Block::Iter::Prev()

Prev()Next()实现不一样,不能简单的将current往上移一个位置。

见下图,假设current_指向Key3,上一个KeyKey2Key2Key3里都没有存储完整的KeyKey3需要依赖Key2来解析出完整的Key3,而Key2需要依赖Key1来解析出完整的Key2,以此类推,Key1需要依赖Key0来解析出完整的Key1,而Key0位于重启点,是没有依赖的,自己本身就存储了完整的Key

所以要找到Key2,我们需要先找到Key3之前最近的一个重启点,也就是RestartPoint0

然后将current_移动到该重启点的位置,再不断的向后边移动current_,边解析出当前Key,直到current_指向Key3的前一个Key,也就是Key2

                              current_+|v+--------+--------+--------+--------+--------+--------+|  Key0  |  Key1  |  Key2  |  Key3  |  Key4  |  Key5  |+--------+--------+--------+--------+--------+--------+^                                   ^|                                   |+                                   +
RestartPoint0                       RestartPoint1
void Prev() override {assert(Valid());// 把 restart_index_ 移动到 current_ 之前最近的一个重启点。const uint32_t original = current_;while (GetRestartPoint(restart_index_) >= original) {if (restart_index_ == 0) {// 前面没有 Key 了current_ = restarts_;restart_index_ = num_restarts_;return;}restart_index_--;}// 把 current_ 移动到重启点的位置,SeekToRestartPoint(restart_index_);do {// 将 current_ 不断向后移动,一直移动到原先 current_ 的前一个位置。} while (ParseNextKey() && NextEntryOffset() < original);
}

Block::Iter::Seek(const Slice& target)

理解Prev()的实现后,Seek()的实现就比较容易理解了。我们不能直接去找target的位置,而是需要先找到target的那个重启点。然后再从这个重启点开始,一步步向右移动current_,直到找到第一个大于等于targetKey

而找重启点的过程,是一个二分查找的过程。

void Seek(const Slice& target) override {// 理解 Prev() 的实现后,Seek() 的实现就比较容易理解了。// 我们不能直接去找 target 的位置,而是需要先找到 target // 的那个重启点。用二分的方式查找这个重启点。uint32_t left = 0;uint32_t right = num_restarts_ - 1;int current_key_compare = 0;if (Valid()) {// 如果当前 Iterator 已经指向某个有效的 Key 了,我们就可以利用这个 Key 来把// 二分查找 target 重启点的范围缩小一些。current_key_compare = Compare(key_, target);if (current_key_compare < 0) {// 如果当前 Key 比 target 小,那么 target 重启点的位置一定在当前重启点的// 右边,包括当前重启点。left = restart_index_;} else if (current_key_compare > 0) {// 如果当前 Key 比 target 大,那么 target 重启点的位置一定在当前重启点的// 左边,包括当前重启点。right = restart_index_;} else {// 如果当前 Key 已经是 target 了,那么就不需要再做其他操作了。return;}}// 二分查找 target 的重启点。while (left < right) {// 找到 left 和 right 中间的那个重启点,看这个重启点的 Key 和 target 的大小关系。//   - 如果 mid 重启点的 Key 比 target 小,那么 target 重启点的位置一定在 mid //     的右边,需要吧 left 移动到 mid 的位置。//   - 如果 mid 重启点的 Key 比 target 大,那么 target 重启点的位置一定在 mid//     的左边,需要把 right 移动到 mid 的位置。    uint32_t mid = (left + right + 1) / 2;uint32_t region_offset = GetRestartPoint(mid);uint32_t shared, non_shared, value_length;const char* key_ptr = DecodeEntry(data_ + region_offset, data_ + restarts_, &shared,&non_shared, &value_length);if (key_ptr == nullptr || (shared != 0)) {CorruptionError();return;}Slice mid_key(key_ptr, non_shared);if (Compare(mid_key, target) < 0) {left = mid;} else {right = mid - 1;}}// 找到 target 的重启点后,一步步向右移动 current_,直到找到第一个大于等于// target 的 Key。assert(current_key_compare == 0 || Valid());bool skip_seek = left == restart_index_ && current_key_compare < 0;if (!skip_seek) {SeekToRestartPoint(left);}while (true) {if (!ParseNextKey()) {return;}if (Compare(key_, target) >= 0) {return;}}
}

Block::Iter::SeekToFist()

void SeekToFirst() override {// 移动到一个重启点。SeekToRestartPoint(0);// 解析出第一个 Key。ParseNextKey();
}

Block::Iter::SeekToLast()

void SeekToLast() override {// 移动到最后一个重启点。SeekToRestartPoint(num_restarts_ - 1);// 不断向后移动 current_,直到最后一个 Key。while (ParseNextKey() && NextEntryOffset() < restarts_) {}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/694535.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【2024软件测试面试必会技能】Appium自动化(4):Appium工作原理及Desired Capabilities配置

Appium工作原理 Appium工作原理图如下&#xff1a; 脚本请求——>4723端口appium server——>解析参数给PC端4724端口——>发送给设备4724端口——>通过设备4724端口发给bootstrap.jar——>Bootstrap.jar把命令发给uiautomator&#xff1b; sonWireProtocol&a…

java常用应用程序编程接口(API)——Objects类和包装类

前言&#xff1a; Object类和Objects类是完全不同的两个类&#xff0c;之前有说过Object类&#xff0c;这次说一下Objects类。打好基础&#xff0c;daydayup! Object类可以看这篇&#xff1a;java常用应用程序编程接口&#xff08;API&#xff09;——Object类概述及常用方法 O…

计算机网络基础之计算机网络组成与分类

计算机网络基础 计算机网络是计算机技术与通信技术发展相结合的产物&#xff0c;并在用户需求的促进下得到进一步的发展。通信技术为计算机之间的数据传输和交换提供了必需的手段&#xff0c;而计算机技术又渗透到了通信领域&#xff0c;提高了通信网络的性能。 计算机网络的…

Codeforces Round 926 (Div. 2) C. Sasha and the Casino

题目链接 思路: 他想知道自己是否可以赢取尽量多的数量的硬币。即他要采取措施让自己的硬币在任何情况下&#xff08;不会连输超过x次&#xff09;都要不断增多。 即我们考虑第一次&#xff0c;第二次&#xff0c;&#xff0c;&#xff0c;第x次&#xff0c;每一次都有赢和输的…

【谈一谈】: 我们工作中的单例模式有哪些写法?

单例模式的多种写法 我们要实现一个单例,首先最重要的是什么? 当然是把构造函数私有化,变成private类型,(为啥? 单例单例,如果谁都能通过构造函数创建对象,还叫单例吗?是不~) 嗯~我们构造函数私有化后,我们应该操作啥呢? 接着我们需要提供一个方法,这个方法要保证初始化有且…

数据脱敏(六)脱敏算法-加密算法

脱敏算法篇使用阿里云数据脱敏算法为模板,使用算子平台快速搭建流程来展示数据 "加密脱敏"是一种数据处理技术&#xff0c;主要用于保护个人隐私和数据安全。它通过将敏感信息&#xff08;如姓名、身份证号、电话号码等&#xff09;进行加密处理&#xff0c;使其无法…

力扣题目-178. 分数排名

力扣题目-178. 分数排名 仅作学习&#xff0c;不作他用 题干 表: Scores Column NameTypeidintscoredecimal 在 SQL 中&#xff0c;id 是该表的主键。 该表的每一行都包含了一场比赛的分数。Score 是一个有两位小数点的浮点值。 查询并对分数进行排序。排名按以下规则计算…

阿里同学聊测试开发与测试平台

在一线大厂&#xff0c;没有测试这个岗位&#xff0c;只有测开这个岗位&#xff0c;即使是做业务测试&#xff0c;那么你的title也是测开。 所以想聊一聊测开的看法&#xff0c;但不代表这是正确的看法&#xff0c;仅供参考。 没来阿里之前我对测开的看法 一直以为专职做自动…

DIcom调试Planar configuration

最近和CBCT组同事调dicom图像 这边得图像模块老不兼容对方得dicom文件。 vtk兼容&#xff0c;自己写得原生解析不兼容。 给对方调好了格式&#xff0c;下次生成文件还会有错。 简单记录下&#xff0c;日后备查。 今天对方又加了 个字段&#xff1a;Planar configuration 查…

Gradio学习(二)—————学习block布局

直接上代码 import gradio as gr with gr.Blocks() as demo: with gr.Tab(“Lion”) gr.Button(“new Lion”) with gr.Tab(“Tiger”): gr.Button(“new Tiger”) #因为在虚拟机中启动&#xff0c;而不是pycharm 所以指定主机ip (1.1.1.1)和端口号,如果是在pycharm 中&#…

【常识】大数据设计基础知识

底层存储&#xff1a;hadoop&#xff08;hdfsmapreduce&#xff09; Hadoop已经有十几年的历史&#xff0c;它是大数据领域的存储基石&#xff0c;HDFS目前仍然没有成熟替代品;MapR 文件系统在业内已经具有一定知名度了&#xff0c;不仅 MapR 宣布它自己的文件系统比 HDFS 快2-…

浙大版C语言题目集-函数题6

6-3 给定两个均不超过9的正整数a和n&#xff0c;要求编写函数求aaaaaa⋯aa⋯a&#xff08;n个a&#xff09;之和。 其中函数fn须返回的是n个a组成的数字&#xff1b;SumA返回要求的和。 #include <stdio.h>int fn( int a, int n ); int SumA( int a, int n );int main…

算法:两数之和

算法&#xff1a;两数之和 方法一&#xff1a;暴力法 function twoSum(nums, target) {for (let i 0; i < nums.length; i) {for (let j i 1; j < nums.length; j) {if (nums[i] nums[j] target) {return [i, j];}}}return null; }方法二&#xff1a;哈希表 func…

BLHeli_S 代码分析—文件 AIKON_Boltlite_30A.inc 分析

BLHeli_S 代码分析—文件 AIKON_Boltlite_30A.inc 分析 简介 根据源代码分析,改文件是配置的 c8051f390 的 MCU。根据该文件的代码配置可以了解到该型号电调的电路连接。包括引导加载程序端口、控制信号(PPM)获取端口、mos管控制端口、比较器反电势端口、调试端口配置。 引导…

【npm】常见错误

1.安装模块错误 错误内容 npm ERR! code EPERM npm ERR! syscall mkdir npm ERR! path E:\Program Files\nodejs\node_modules\live-server npm ERR! errno -4048 npm ERR! Error: EPERM: operation not permitted, mkdir E:\Program Files\nodejs\node_modules\live-server n…

道可云元宇宙每日资讯|上海市第二批元宇宙重大应用场景张榜

道可云元宇宙每日简报&#xff08;2024年2月18日&#xff09;讯&#xff0c;今日元宇宙新鲜事有&#xff1a; 上海市第二批元宇宙重大应用场景张榜 根据《上海市培育“元宇宙”新赛道行动方案》&#xff0c;市经济信息化委、市文化旅游局、市卫生健康委、市教委联合启动了上海…

【Unity】【VRTK】【VR开发】同时保持高效打包和调试的VRTK项目设置方式

【背景】 开发功能时希望能够快速调试&#xff0c;在Preview和开发编辑器间流畅切换。后期又希望快速打包到目标安卓平台&#xff0c;感受头盔内部的画面和操作效果。麻烦在于&#xff0c;这两者往往不是明确区分的&#xff0c;很可能一会儿只是想快速验证一下某些功能动作&am…

二进制搭建 Kubernetes

实验流程 k8s集群master01&#xff1a;192.168.75.10 kube-apiserver kube-controller-manager kube-scheduler etcd k8s集群master02&#xff1a;192.168.80.20 k8s集群node01&#xff1a;192.168.75.20 kubelet kube-proxy docker k8s集群node02&#xff1a;192.168.…

Out of memory,realloc failed

git config --global http.postBuffer 1048576000

【软考】软件维护

目录 一、说明二、正确性维护三、适应性维护四、完善性维护五、预防性维护 一、说明 1.软件维护主要是根据需求变化或硬件环境的变化对应用程序进行部分或全部修改 2.修改时应充分利用源程序&#xff0c;修改后要填写程序修改登记表&#xff0c;并在程度变更通知书上写明新旧程…