文件系统小册(FusePosixK8s csi)【1 Fuse】

文件系统小册(Fuse&Posix&K8s csi)【1 Fuse:用户空间的文件系统】

Fuse(filesystem in userspace),是一个用户空间的文件系统。通过fuse内核模块的支持,开发者只需要根据fuse提供的接口实现具体的文件操作就可以实现一个文件系统。由于其主要实现代码位于用户空间中,而不需要重新编译内核,这给开发者带来了众多便利。

  • 虽然Fuse简化了文件系统的实现,给开发者带来了便利。但是其额外的内核态/用户态切换带来的性能开销不能被忽视,所以fuse性能问题,一直是业界绕不开的话题。下面说到的splice、多线程、writeback cache都是为了改善其性能问题。

1 架构设计(执行流程)

  1. 用户程序挂载到fuse文件系统,比如此时执行ls命令
  2. VFS(虚拟文件系统)检测到挂载到fuse文件系统上的用户程序发送的请求,会将其转发给fuse driver
  3. fuse driver接受到request请求,会将其保存到queue中,同时暂停用户程序(ls会卡主,等待返回结果),同时唤醒fuse daemon处理请求
  4. fuse daemon(守护进程)通过/dev/fuse读取queue中的request,经过处理后将其转发给内核底层文件系统(EXT4等)。
  5. 内核文件系统处理完成后将结果返回给fuse daemon,fuse daemon将结果写回/dev/fuse
  6. fuse driver将该request标记为completed,并唤醒用户进程,返回对应执行结果。(ls执行结束,终端展示文件列表)
    在这里插入图片描述

2 相关组件

①VFS:转发请求给fuse driver

VFS(虚拟文件系统)检测到挂载到fuse文件系统上的用户程序发送的请求,会将其转发给fuse driver

② FUSE drvier(queue):接受请求保存到queue

fuse driver接受到request请求,会将其保存到queue中,同时暂停用户程序(ls会卡主,等待返回结果)

③/dev/fuse(桥梁):fuse daemon通过/dev/fuse读取queue中的请求

FUSE 驱动程序(fuse driver)处理请求并将其加入队列,然后通过 /dev/fuse 文件(FUSE 守护程序无法读取该文件)中的特定连接实例将请求提交给负责处理该 FUSE 文件系统的 FUSE 守护程序。

  • fuse daemon通过/dev/fuse来读取request queue中的请求

④fuse daemon(中间人):从queue中读取请求转发给底层文件系统

fuse daemon(守护进程)通过/dev/fuse读取queue中的request,经过处理后将其转发给内核底层文件系统(EXT4等)。

⑤fuse lib:提供接口和内核fuse模块通信

fuse的lib库,封装好了对应接口。fuse的lib库,提供接口和内核fus模块通信

⑥内核文件系统(如:EXT4)

内核层面的文件系统,真正操作文件的系统。

3 实现细节

① fuse用户空间流程

1. fuse mount:通过mount函数将path挂载到/dev/fuse设备

Fuse的挂载通过mount函数,将指定的fuse_path挂载到/dev/fuse设备上。之后对于fuse_path下的文件操作,都会通过fuse文件系统,并通过/dev/fuse被fuse daemon读取处理。

在这里插入图片描述

2. fuse thread:fuse daemon创建的服务线程

Fuse daemon还会创建一个服务线程,基于libfuse库来处理文件操作请求。这里主要关注fuse_session_new和fuse_session_loop_mt。通过fuse_session_new在libfuse中注册了fuse daemon实现的fuse_lowlevel_ops,之后通过fuse的所有的文件操作,都会通过libfuse回调到fuse daemon进行处理。fuse_session_loop_mt在libfuse中实现了一个多线程模式来读取请求,相比单线程,在请求处理上效率更高。

  • fuse daemon创建的服务线程
  • 基于libfuse库处理请求
  • 可多线程模式
  • 通过fuse_session_new(new一个session,与内核fuse模块通信)+fuse_session_loop_mt(多线程处理请求)

在这里插入图片描述

3. libfuse:fuse的lib库,提供接口和内核fus模块通信

fuse_session_loop_mt:fuse thread基于多线程方式处理请求

  • splice实现内存零拷贝。在默认情况下,fuse daemon必须通过read()从/dev/fuse读取请求,通过write()将请求回复写入/dev/fuse。每次读写系统调用都需要进行一次内核-用户空间的内存拷贝。这样对读写的性能损耗十分严重,因为一次内存拷贝需要处理大量数据。为了缓解这个问题,fuse支持了Linux内核提供的 splice 功能。splice 允许用户空间在两个内核内存缓冲区之间传输数据,而无需将数据复制给用户空间。如果fuse daemon实现了write_buf()方法,则 FUSE 从/dev/fuse读取数据,并以包含文件描述符的缓冲区的形式将数据直接传递给此方法处理,从而省去了一次内存申请与拷贝。[提供缓冲区传数据,避免用户空间与内核空间来回切换耗时]
  • 多线程模式。在多线程模式下,fuse daemon以一个线程开始,如果内核队列中有两个以上的request,则会自动生成其他线程。默认最大支持10个线程同时处理请求。 [多线程:队列request>2,自动生成新线程,最大支持10并发]在这里插入图片描述

②fuse内核队列(维护了5个队列)

fuse在内核中维护了五个队列,分别为:Backgroud、Pending、Processing、Interrupts、Forgets。一个请求在任何时候只会存在于一个队列中。

  • Backgroud:存异步请求
  • Pending:存同步请求
  • Processing:存处理中的请求
  • Interrupts:存中断请求(如:用户ctrl+C,取消请求),优先级最高
  • Forgets:存forget请求(清理cache中的inode)

在这里插入图片描述

1. Backgroud:暂存异步请求

Backgroud:background 队列用于暂存异步请求。在默认情况下,只有读请求进入 background 队列;当writeback cache启用时,写请求也会进入 background 队列。当开启writeback cache时,来自用户进程的写请求会先在页缓存中累积,然后当bdflush 线程被唤醒时会下刷脏页。在下刷脏页时,FUSE会构造异步请求,并将它们放入 background 队列中。

2. Pending:存储同步请求

同步请求(例如,元数据)放在 pending 队列中,并且pending队列会周期性接收来自background 的请求。但是pending队列中异步请求的个数最大为max_background(最大为12),当pending队列的异步请求未达到12时,background队列的请求将被移动到pending队列中。这样做的目的是为了控制pending队列中异步请求的个数,防止在突发大量异步请求的情况下,阻塞了同步请求。

3. Processing:存储正在处理的请求

Processing:当pending队列中的请求被转发到fuse daemon的同时,也被移动到processing队列。所以processing队列中的请求,表示正在被处理fuse daemon处理的请求。当fuse daemon真正处理完请求,通过/dev/fuse下发reply时,该请求将从processing队列中删除。

4. Interrupts:存放中断请求(用户取消请求:如:ctrl+C)

Interrupts:用于存放中断请求,比如当发送的请求被用户取消时,内核会发送一个Interrupts请求,来取消已被发送的请求。中断请求的优先级最高,Interrupts中的请求会最先得到处理。

5. Forgets:记录清理cache中inode的请求

Forgets:存储forgets请求,forget请求用于删除cache中缓存的inode。

③/dev/fuse 读写调用流程

Fuse driver加载过程中注册了对/dev/fuse的操作接口fuse_dev_operations。fuse_dev_do_read/fuse_dev_do_write分别对应fuse daemon从内核读取请求,以及处理完请求后写回reply的函数调用。

  1. pending 、interrups、forgets队列为空时,读进程休眠。
  2. 一旦有request到达,对应等待队列上的进程被唤醒(Interrups 和 forgets优先级高于pending队列请求)
  3. 当请求数据内容被拷贝到用户空间后(fuse daemon在进行处理了)
  4. 该请求被移动到processing队列,标识该请求已被处理。
  5. req->flags会保存当前请求的状态
  6. fuse daemon处理完请求后(fuse daemon与内核底层FS打交道)
  7. fuse daemon将结果写回到/dev/fuse。
  • 其中写数据保存在struct fuse_copy_state中,并且会根据unique id在fc(fuse_conn)中找到对应的req,并将写回的参数从fuse_copy_state拷贝至req->out。

源码逻辑:

当pending 、interrups、forgets队列都没有请求时,读进程进入休眠。一旦有请求到达,这个等待队列上的进程将被唤醒。Interrups 和 forgets的请求优先级高于pending队列。当请求的数据内容被拷贝至用户空间后,该请求会被移至processing队列,并且req->flags会保存当前请求的状态。

在这里插入图片描述

当fuse daemon处理完请求后,会将结果写回到/dev/fuse。写数据保存在struct fuse_copy_state中,并且会根据unique id在fc(fuse_conn)中找到对应的req,并将写回的参数从fuse_copy_state拷贝至req->out。

在这里插入图片描述

4案例:以unlink为例

  1. fuse daemon会阻塞在读/dev/fuse,当app进程在fuse挂载点下面有新的文件操作(unlink)
  2. 这时系统调用会调用fuse内核接口,并生成request,同时唤醒阻塞的fuse daemon
  3. fuse daemon读到request后,在libfuse中进行解析,根据request的opcode来执行对应的ops
  4. 完成后会把处理结果返回给/dev/fuse。此时vfs调用阻塞的行为将被唤醒,最后返回vfs调用。

在这里插入图片描述

5 实战(go-fuse)

相关仓库地址:

  • https://github.com/hanwen/go-fuse
  • https://github.com/bazil/fuse
  • https://github.com/libfuse/libfuse/

Golang操作fuse的库主要有go-fuse、libfuse。这里主要讲解go-fuse

①概述

Go-Fuse 是一个开源的库,由 Han-Wen Nienhuys 创建并维护。该库提供了对 Linux FUSE(Filesystem in Userspace)接口的支持,使得开发人员可以使用 Go 语言构建自己的文件系统。
功能:

  • 构建自定义文件系统:使用 Go-Fuse,您可以根据需要构建自己的文件系统。这可能包括加密、压缩、优化性能等功能。
  • 支持各种平台:由于 Go-Fuse 基于 FUSE,因此它可以跨多个操作系统(如 Linux、macOS 和 Windows)运行。
  • 高度自定义:通过实现特定的接口方法,您可以控制文件系统的每个细节。这为实现复杂的文件系统行为提供了极大的灵活性。

②环境准备

我准备在我本地macos上构建,因此需要fuse命令。

  • macos:https://github.com/osxfuse/osxfuse/releases(下载dmg安装配置)
  • ubuntu: sudo apt-get -y update && sudo apt-get install -y fuse
  • centos:sudo yum -y update && sudo yum install -y fuse

安装好之后,需要确保当前用户需要有执行fuse命令的权限

# 如果当前用户没有权限,可以进行提权或者切换用户,或者修改fuse配置
vim /etc/fuse.conf打开user_allow_other

③全部代码&解析

//安装依赖
go get "github.com/hanwen/go-fuse/v2/fs"
go get "github.com/hanwen/go-fuse/v2/fuse"
package mainimport ("context""flag""log""syscall""github.com/hanwen/go-fuse/v2/fs""github.com/hanwen/go-fuse/v2/fuse"
)type HelloRoot struct {fs.Inode
}func (r *HelloRoot) OnAdd(ctx context.Context) {ch := r.NewPersistentInode(ctx, &fs.MemRegularFile{Data: []byte("file.txt data"),Attr: fuse.Attr{Mode: 0644,},}, fs.StableAttr{Ino: 2})r.AddChild("file.txt", ch, false)
}func (r *HelloRoot) Getattr(ctx context.Context, fh fs.FileHandle, out *fuse.AttrOut) syscall.Errno {out.Mode = 0755return 0
}var _ = (fs.NodeGetattrer)((*HelloRoot)(nil))
var _ = (fs.NodeOnAdder)((*HelloRoot)(nil))//./yi-fuse test
func main() {debug := flag.Bool("debug", false, "print debug data")flag.Parse()if len(flag.Args()) < 1 {log.Fatal("Usage:\n  ./yi-fuse MOUNTPOINT")}opts := &fs.Options{}opts.Debug = *debugserver, err := fs.Mount(flag.Arg(0), &HelloRoot{}, opts)if err != nil {log.Fatalf("Mount fail: %v\n", err)}server.Wait()
}
  • 我们通过go-fuse库创建了一个用户空间文件系统,该文件系统只包含一个名为file.txt的文件。
  • context:用于处理上下文,可以在异步操作中取消请求。
  • flag:处理命令行参数。
  • log:日志记录。
  • syscall:系统调用接口。
  • fs 和 fuse:来自github.com/hanwen/go-fuse/v2的库,用于实现用户空间文件系统。
  • HelloRoot 结构体:
    • 表示文件系统的根节点,实现了NodeGetattrer和NodeOnAdder接口。
    • OnAdd 方法:当文件系统被加载时调用,创建一个包含file.txt的持久化节点。
    • Getattr 方法:获取文件属性,将file.txt的权限设置为0755。
    • main 函数:
      处理命令行参数,设置调试标志。
      检查至少有一个挂载点参数。
      创建fs.Options,启用调试模式。
      调用fs.Mount挂载文件系统。
      如果挂载失败,打印错误信息并退出。
  • server.Wait()阻塞直到文件系统卸载。

④测试

//编译可执行文件到linux
GOOS=linux GOARCH=amd64 go build -o yi-fuse main.go 
//创建挂载目录
mkdir -p /root/test
//执行挂载(如果不加nohup,默认前台运行)
nohup ./yi-fuse /root/test &//预期返回我们代码里写的file.txt文件
ls -l /root/test//读取file.txt文件内容
cat /root/test/file.txt//卸载挂载
umount /root/test

在这里插入图片描述

参考文章:
https://www.cnblogs.com/Linux-tech/p/14110335.html
https://blog.csdn.net/gitblog_00007/article/details/136569849

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/20164.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【测评|白嫖】雨云宁波新区,2C4G200M,公测期间全免费!

雨云香港三区云服务器&#xff0c;高性能的 Xeon Platinum 处理器 企业级 NVME SSD 高性能云服务器。 一键白嫖链接&#xff1a;https://www.rainyun.com 本篇纯测评&#xff0c;无任何广告&#xff0c;请放心食用&#xff01;&#xff01; 本次测评服务器配置如下&#xff1…

用万界星空科技低代码平台能快速搭建一个云MES系统

一、低代码平台与MES:智能制造的新篇章 随着工业4.0和智能制造的兴起&#xff0c;企业对于生产过程的数字化、智能化需求日益迫切。传统的MES系统实施周期长、成本高&#xff0c;成为许多企业数字化转型的瓶颈。而低代码开发平台的出现为这一问题提供了新的解决思路。 二、万界…

linux可观测性ebpf(一) ----------- 环境搭建

参考书籍 开发环境 Ubuntu 18.04.6 LTS (GNU/Linux 5.4.0-150-generic x86_64) 1.1 下载内核源码 cd /usr/src/ sudo git clone -b v5.4 https://github.com/torvalds/linux.git1.2 下载书中代码 git clone https://github.com/bpftools/linux-observability-with-bpf1.3 编…

海外媒体通稿:9个极具创意的旅游业媒体推广案例分享-华媒舍

如今&#xff0c;旅游业正迅速发展&#xff0c;媒体推广成为吸引游客的关键。为了更好地展示旅游目的地&#xff0c;许多创意而富有创新的媒体推广策略应运而生。本文将介绍九个极富创意的旅游业媒体推广案例&#xff0c;为广大从业者带来灵感和借鉴。 1. 视频系列&#xff1a;…

4. MySQL 约束

文章目录 【 1. 主键约束 PRIMARY KEY 】1.1 在创建表时设置主键约束设置单字段主键在创建表时设置联合主键 1.2 在修改表时添加主键约束1.3 删除主键约束1.4 主键自增长 AUTO_INCREMENT指定自增字段初始值自增字段不连续 【 2. 外键约束 FOREIGN KEY 】2.1 在创建表时设置外键…

Mybatis数据加密解密

文章目录 Mybatis数据加密解密一、自定义注解二、自定义参数处理拦截器结果集拦截器加密解密 Mybatis数据加密解密 方案一&#xff1a;Mybatis拦截器之数据加密解密【Interceptor】 拦截器介绍 Mybatis Interceptor 在 Mybatis 中被当作 Plugin(插件)&#xff0c;不知道为什么…

ARM32开发——LED点灯

&#x1f3ac; 秋野酱&#xff1a;《个人主页》 &#x1f525; 个人专栏:《Java专栏》《Python专栏》 ⛺️心若有所向往,何惧道阻且长 文章目录 点灯的两种方式灌入电流法输出电流法扩展板点灯点灯方式点亮LED1-4完整实现 点灯的两种方式 不同颜色LED&#xff0c;达到相同亮度…

[数据集][目标检测]猫狗检测数据集VOC+YOLO格式8291张2类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;8291 标注数量(xml文件个数)&#xff1a;8291 标注数量(txt文件个数)&#xff1a;8291 标注…

ETLCloud中如何使用Kettle组件

ETLCloud中如何使用Kettle组件在当今数据驱动的时代&#xff0c;数据处理和分析已成为企业决策的关键。为了更高效地处理海量数据&#xff0c;ETL&#xff08;Extract, Transform, Load&#xff09;工具变得至关重要。而在众多ETL工具中&#xff0c;Kettle作为一款开源、灵活且…

攻防实战 | 邮件高级威胁检测与自动化响应

历经三个月的时间&#xff0c;年度重磅直播节目Fortinet 2024年度“Demo季”近日终于迎来了备受瞩目的压轴大戏——Demo Day第三期&#xff0c;主题为《新邮件安全下的高级威胁检测与自动化响应》。继成功举办了前两期《企业网络中的多源威胁情报自动化整合与集成》和《应急响应…

Pycharm使用时的红色波浪线报错——形如‘break‘ outside loop

背景&#xff1a; 我在一个方法中&#xff0c;写了一个if判断&#xff0c;写了一个break&#xff0c;期望终止这个函数&#xff0c;编辑器出现报错 形如下图 视频版问题教程&#xff1a; Pycharm下出现波浪线报错&#xff0c;形如break outside loop 过程&#xff1a; 很奇…

IDEA一键启动多个微服务

我们在做微服务项目开发的时候&#xff0c;每次刚打开IDEA&#xff0c;就需要把各个服务一个个依次启动&#xff0c;特别是服务比较多时&#xff0c;逐个点击不仅麻烦还费时。下面来说一下如何一键启动多个微服务。 操作步骤 点击Edit Configurations 2.点击“”&#xff0c;…

【设计模式】JAVA Design Patterns——Facade(外观模式)

&#x1f50d;目的 为一个子系统中的一系列接口提供一个统一的接口。外观定义了一个更高级别的接口以便子系统更容易使用。 &#x1f50d;解释 真实世界例子 一个金矿是怎么工作的&#xff1f;“嗯&#xff0c;矿工下去然后挖金子&#xff01;”你说。这是你所相信的因为你在使…

性价比为王,物流商怎么选择高效的国际物流管理平台

在全球化贸易日益繁荣的今天&#xff0c;国际物流行业作为链接国内商家和海外市场的重要桥梁&#xff0c;发挥着极其重要的作用。 然而&#xff0c;随着国际物流市场竞争的加剧&#xff0c;对物流商来说&#xff0c;也面临着成本管控和效率提升的双重挑战。今天我们会重点探讨…

解决 DataGrip 2024.1.3 连接 Tdengine 时timestamp字段显示时区不正确问题

设置中找到该设置&#xff0c;将原来的设置 yyyy-MM-dd HH:mm:ss 修改为: yyyy-MM-dd HH:mm:ss.SSS z 即可。 注意&#xff1a;只能修改第一个,修改后提示错误&#xff0c;但是查询数据时能成功格式化时间&#xff0c;修改第二个不生效&#xff0c;可能是 bug 具体格式见: Date…

Opera 浏览器与Google联手,推出由Gemini驱动的全新AI功能

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

富士摄像机X-H2S MOV格式化后重新写入后的恢复方法

X-H2S是富士数码的一款旗舰机型&#xff0c;支持4K/6K高清&#xff0c;视频编码为最新的HVC。下面我们来看下富士数码摄像机恢复案例。 故障存储:512G存储卡 Exfat文件系统 故障现象: 512G的卡误格式化后又进行了拍摄&#xff0c;卡使用了120G不到的空间&#xff0c;其它底…

【EFK日志系统】docker一键部署kibana、es-head

docker一键部署kibana、es-head kibana部署es-head部署 上一篇文章搭建了es集群 规划服务器是 es01:172.23.165.185 es02:172.23.165.186 es03:172.23.165.187 那么kibana就搭建在主节点es01:172.23.165.185 按照顺序参考&#xff1a; docker一键部署EFK系统&#xff08;elas…

详解生成式人工智能的开发过程

回到机器学习的“古老”时代&#xff0c;在您可以使用大型语言模型&#xff08;LLM&#xff09;作为调优模型的基础之前&#xff0c;您基本上必须在所有数据上训练每个可能的机器学习模型&#xff0c;以找到最佳&#xff08;或最不糟糕&#xff09;的拟合。 开发生成式人工智能…

【linux】线程同步和生产消费者模型

线程同步 当我们多线程访问同一个临界资源时&#xff0c;会造成并发访问一个临界资源&#xff0c;使得临界资源数据不安全&#xff0c;我们引入了锁的概念&#xff0c;解决了临界资源访问不安全的情况&#xff0c;对于线程而言竞争锁的能力有强有弱&#xff0c;对于之前就抢到…