HDFS Lease详解

本文主要介绍hdfs lease的设计以及实现。

写在前面

https://www.cnblogs.com/jhcelue/p/6783076.html

https://blog.csdn.net/yexiguafu/article/details/118890014

https://www.jianshu.com/p/33e1a5a2b876

https://blog.csdn.net/breakout_alex/article/details/101456998

https://www.cnblogs.com/Scott007/archive/2013/05/30/3108928.html

读写锁简介,现实中有许多写少读多的场景,在程序实现时就期望同一时间只能有一个写线程可以获取写锁,但是同时可以多个读线程可以获取读锁,于是java便有了ReentrantReadWriteLock。ReentrantReadWriteLock采用读写分离策略,允许多个线程可以同时获取读锁。后面文章中提及的读写锁就使用此种实现。

Hdfs Lease简介

HDFS被设计成Write-Once-Read-Many,即不支持并发写,这里的写不单单指数据写入,也包括创建,修改等。当一个客户端向Namenode获取文件锁以后,其他客户端应该获取不到。这里会有个问题,如果多客户端同时获取,怎么保证一致性呢?很明显Namenode那边需要一个请求读写锁,保证请求的一致性。HDFS使用FSNamesystemLock一个大的读写锁,所有文件rpc操作都共用此锁,逻辑上比较简单。当要写一个文件时,先要获取到大的write锁,后面才获取文件的锁信息。

1889_1.jpeg

这里会有一个问题,就是如果某个客户端获取到锁信息以后,异常关闭,这个文件会永远被锁住,所以锁信息应该要有一个时效,有时效的锁信息hdfs称之为lease。常见的做法是client保存lease,根据失效时间去更新lease。但是hdfs client不会获取和保存lease而是定时去renew lease,来保证server端lease不失效。

1889_2.jpeg

Lease构成

class Lease {private final String holder;private long lastUpdate;private final HashSet<Long> files = new HashSet<>();
}

Holer:clientName,这里要注意的是clientName如何产生。

this.clientName = "DFSClient_"+ dfsClientConf.getTaskId()+"_" +ThreadLocalRandom.current().nextInt()  + "_" +Thread.currentThread().getId();

不同进程不同线程都唯一,具体看客户端是否共用一个实例。
lastUpdate:lease最后更新时间。
Files:这个客户端的占用files的inode列表。

Lease过期相关

Hdfs对于所有的lease过期判断都使用统一值,并且不能配置。主要有两个值,softLimit和hardLimit,这两个值都在leaseManager中。
softLimit值为60s,主要用于判断lease过期。值得注意的是不会有线程定时去判断lease是否softLimit过期,而是先有A客户端占用file的lease,后有B客户端也需要去获取同一个file的lease,发现A的lease的lastUpdate与当前时间差值大于softLimit,A的lease会失效,B会获取此file的新lease。这里就会发现一个问题,如果A发生错误了以后,没有其他人再去访问A所占用的file,这个file lease会永远遗留在内存中,所以hardLimit产生了。
hardLimit值为3600s,有一个线程会定时判断lease是否hardLimit过期,过期就处理。

Lease的客户端更新

客户端会定时去更新lease,由于lease是对于clientName来说,所以renew lease只需要clientName,通过单次renew可以更新此clientName占用的所有file。更新的频率是softLimit/2即30s,如果client的rpctimeout小于60s,为rpctimeout/2。

Lease recover

正常情况下client端不需要考虑lease的回收,当发生一些奇怪问题的时候,客户端也可以选择去发rpc recoverlease去回收lease。下面主要剖析正常情况下namenode如何recoverlease。还有一个要注意的是一个文件处于underConstruction和这个文件有lease本质上是成对出现的,在设计层面来说这两个东西具有一致性。

由于softLimit的设计,所以任何需要addLease之前,都会去判断是否存在lease,以及存在lease是否需要recoverLease,这些实现都是在FSNamesystem.recoverLeaseInternal中实现,这个方法本质做了以下事情:

1889_3.jpeg

图中recoverLease还有一些block相关的判断,后面研究block的时候会补全。

与Lease相关的RPC接口

用到lease的rpc:Create,append,truncate。RenewLease,recoverLease。
用到File underConstruction的rpc:getFileInfo,getBlockLocations,isFileClose,complete,addblock,abandonBlock。

喜欢就点赞、收藏一下~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/819380.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

行业模板|DataEase批发零售大屏模板推荐

DataEase开源数据可视化分析平台于2022年6月发布模板市场&#xff08;https://templates-de.fit2cloud.com&#xff09;&#xff0c;并于2024年1月新增适用于DataEase v2版本的模板分类。模板市场旨在为DataEase用户提供专业、美观、拿来即用的大屏模板&#xff0c;方便用户根据…

【Canvas与艺术】绘制斜置黄色三角biohazard标志

【关键点】 径向渐变色和文字按角度偏转。 【成果图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>使用Html5/Canvas绘制…

spring-cloud微服务gateway

核心部分&#xff1a;routes(路由)&#xff0c; predicates(断言)&#xff0c;filters(过滤器) id&#xff1a;可以理解为是这组配置的一个id值&#xff0c;请保证他的唯一的&#xff0c;可以设置为和服务名一致 uri&#xff1a;可以理解为是通过条件匹配之后需要路由到&…

2024 CKA 基础操作教程(十二)

题目内容 考点相关内容分析 Pods Pod 是可以在 Kubernetes 中创建和管理的、最小的可部署的计算单元。 Pod 是 Kubernetes 中的原子单元&#xff0c;用于封装应用程序的一个或多个容器、存储资源、唯一的网络 IP&#xff0c;以及有关如何运行容器的选项。Pod 提供了一个共享的…

一些实用的工具网站

200 css渐变底色 https://webgradients.com/ 200动画效果复制 https://css-loaders.com/classic/ 二次贝塞尔曲线 https://blogs.sitepointstatic.com/examples/tech/canvas-curves/bezier-curve.html 三次贝塞尔曲线 https://blogs.sitepointstatic.com/examples/tech/c…

Day92:系统攻防-WindowsLinux远程探针本地自检任意执行权限提升入口点

目录 操作系统-远程漏扫-Nessus&Nexpose&Goby Nessus Nexpose 知识点&#xff1a; 1、远程漏扫-Nessus&Nexpose&Goby 2、本地漏扫-Wesng&Tiquan&Suggester 3、利用场景-远程利用&本地利用&利用条件 操作系统-远程漏扫-Nessus&Nexpose&a…

Python——详细解析目标检测xml格式标注转换为txt格式

本文简述了目标检测xml格式标注的内容&#xff0c;以及yolo系列模型所需的txt格式标注的内容。并提供了一个简单的&#xff0c;可以将xml格式标注文件转换为txt格式标注文件的python脚本。 1. xml格式文件内容 <size>标签下为图片信息&#xff0c;包括 <width> …

​​​​​​​iOS配置隐私清单文件App Privacy Configuration

推送到TestFlight后邮件收到警告信息如下&#xff0c;主要关于新的隐私政策需要补充&#xff1a; Hello, We noticed one or more issues with a recent submission for TestFlight review for the following app: AABBCC Version 10.10.10 Build 10 Although submission for …

servlet的三个重要的类(httpServlet 、httpServletRequst、 httpServletResponse)

一、httpServlet 写一个servlet代码一般都是要继承httpServlet 这个类&#xff0c;然后重写里面的方法 但是它有一个特点&#xff0c;根据之前写的代码&#xff0c;我们发现好像没有写main方法也能正常执行。 原因是&#xff1a;这个代码不是直接运行的&#xff0c;而是放到…

文章解读与仿真程序复现思路——中国电机工程学报EI\CSCD\北大核心《应用图论建模输电网的电力现货市场出清模型》

本专栏栏目提供文章与程序复现思路&#xff0c;具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

JavaSE图书管理系统实战

代码仓库地址&#xff1a;Java图书管理系统 1.前言 该项目将JavaSE的封装继承多态三大特性&#xff0c;使用了大量面向对象的操作&#xff0c;有利于巩固理解 &#xff08;1&#xff09;实现效果 2.实现步骤 第一步先把框架搭建起来&#xff0c;即创建出人&#xff1a;管理员和…

RocketMQ 02 功能大纲介绍

RocketMQ 02 主流的MQ有很多&#xff0c;比如ActiveMQ、RabbitMQ、RocketMQ、Kafka、ZeroMQ等。 之前阿里巴巴也是使用ActiveMQ&#xff0c;随着业务发展&#xff0c;ActiveMQ IO 模块出现瓶颈&#xff0c;后来阿里巴巴 通过一系列优化但是还是不能很好的解决&#xff0c;之后…

MySQL底层架构

MySQL底层架构 连接器 验证客户端连接的用户名密码、校验权限、维持和管理连接。 客户端如果超过 wailt_timeout 没有动静&#xff0c;连接器会主动将它断开&#xff0c;此时客户端再次发送请求的话&#xff0c;就会收到错误&#xff1a;lost connection to MySQL server dur…

【Modelsim】保持波形格式重编译and波形的保存与查看

文章目录 保持原波形格式重编译波形的保持与查看保存波形打开工程查看波形 保持原波形格式重编译 Modelsim 仿真设置好波形格式后&#xff0c;若需要修改代码并保持原波形格式重新查看波形&#xff0c;只需将文件重新编译后仿真即可。 1.修改代码后Project页面的代码状态变成…

外网如何访问内网数据库?

在当今信息时代&#xff0c;随着互联网的快速发展&#xff0c;很多企业和个人都面临着外网访问内网数据库的需求。外网访问内网数据库可以实现远程操作&#xff0c;方便用户在任何地点使用移动设备进行数据管理和查询。本文将介绍一种名为【天联】的组网产品&#xff0c;它是一…

SkyWalking 为所有的API接口增加 tag

背景胡扯 线上接口报错&#xff0c;接着被 SkyWalking 抓到&#xff0c;然后 SkyWalking 触发告警&#xff0c;最后老板你&#xff0c;让你辛苦一下&#xff0c;在明早上班前把这个bug 改了&#xff0c;并告诉你你是全公司的希望。谁说不是呢&#xff1f;为公司业务保驾护航&a…

C语言 | 自定义类型:struct结构体(详解)

目录&#xff1a; --前言 1. 结构体类型的定义与基础结构 2. 结构体的使用 3. typedef相关 4. 结构体的自引用 5. 结构体内存对齐 6. 结构体传参 7. 结构体实现位段 --前言&#xff1a; c语言中内置类型&#xff0c;也有自定义的类型。 例如&#xff1a;内置类型 in…

windows应急响应基础知识

一、系统排查 1、系统详细信息 systeminfo2、网络链接 netstat -ano LISTENING 服务启动后首先处于侦听 ESTABLISHED 建立连接。表示两台机器正在通信。 CLOSE_WAIT 对方主动关闭连接或者网络异常导致连接中断&#xff0c;这时我方的状态会变成CLOSE_WAIT 此时我方要调用…

【计算机考研】408网课汇总+资源分享

408王道的视频就比较通俗易懂 王道的教材非常契合408的大纲&#xff0c;是专门为408大纲而编写的&#xff0c;而教材是方方面面都讲解的透彻。 建议王道为主&#xff0c;网络搜索为辅&#xff01; 王道中讲解不清楚&#xff0c;看不懂的知识点&#xff0c;可以尝试在网络上进…

LeetCode 热题 100 Day03

普通数组 常见的题型有&#xff1a; 取模、区间合并、最大子序列和、最长非0子序列等。 一些解题思路很巧妙&#xff0c;多练多总结。 Leetcode 53. 最大子数组和 [dp动态查找最大值] 题目理解&#xff1a; 给定一个整数数组, 求一个连续的子序列 该子序列满足和最大 要求返回最…