在Linux下面的链接文件有两种,
- 一种是类似Windows的快捷方式功能的文件,可以让你快速地链接到目标文件(或目录);
- 另一种则是通过文件系统的inode 链接来产生新文件名,而不是产生新文件,这种称为硬链接(hard link),这两种玩意儿是完全不一样的东西,现在就分别来谈谈。
1.硬链接(Hard Link,硬式链接或实际链接)
我们知道几件重要的信息,包括:
- 每个文件都会占用一个inode,文件内容由inode的记录来指向;
- 想要读取该文件,必须要经过目录记录的文件名来指向到正确的inode号码才能读取。
也就是说,其实文件名只与它所处的目录有关,但是文件内容则与它自己的inode有关。
那么想一想,有没有可能有多个文件名对应到同一个inode号码?
有的,那就是硬链接的由来,所以简单地说:硬链接只是在某个目录下新增一条文件名链接到某inode号码的关联记录而已。
由于linux下的文件是通过索引节点(Inode)来识别文件,硬链接可以认为是一个指针,指向文件索引节点的指针,系统并不为它重新分配inode。每添加一个一个硬链接,文件的链接数就加1。
我们看个例子
#根目录下创建文件夹hardlink,并且在hardlink内创建文件aa.txt
#查看其链接数为1,注意,此处链接数就是硬链接的次数
#创建硬链接
#往aa.txt文件中写入一些内容
#发现aa.link中也同样可以看到#删除aa.txt,aa.link依然可以正常查看内容,链接数 -1,inode不变
我们回过头来看这个例子
你有没有发现两个文件名都链接到1048579这个inode号码,所以你看看是不是所以您看看,是否文件的权限与属性完全一样?
因为这两个文件名其实是一模一样的文件,而且你也会发现第二个字段由原本的1变成2,那个字段称为链接,这个字段的意义为:有多少个文件名链接到这个inode 号码。如果将读取到正确数据的方式画成示意图,就类似下图:
上图的意思是,你可以通过User1或User2或User3的目录的inode指定的区块找到两个不同的文件名,而不管使用哪个文件名均可以指到那个 inode去读取到最终数据。那这样有什么好处?
- 最大的好处就是安全,如同上图中,如果你将任何一个文件名删除,其实inode与区块都还是存在的。此时你可以通过另一个文件名来读取到正确的文件数据。
- 此外,不论你使用哪个文件名来编辑,最终的结果都会写入到相同的inode与区块中,因此均能进行数据的修改。
一般来说,使用硬链接设置链接文件时,磁盘的空间与inode的数目都不会改变。
由图中可以知道,硬链接只是在某个目录下的区块多写入一个关联数据而已,既不会增加inode 也不会消耗区块数量。
我们接着上面那个例子来讲
那这时候,就有个疑问了,如果链接数只剩下一个,再次删除,会进行什么样的操作呢?
实际上,
- 如果我们这时候再删除aa.link这个文件,系统只会删除掉inode table中aa.link指向的inode信息,和hardlink 目录项中aa.link的相关信息。
- 然后会将aa.link inode指针(也就是硬链接)所指向的数据块设置为空闲的状态,告诉系统这些数据块可以被再次使用。
- 而里面的内容却不会被删除,直到新的数据覆盖为止!
这也就说明了,实际上 linux中被删除的文件数据是可以被找回的,只要相应的数据块没有被再次覆盖使用。
如果观察的再细致一些,我们会发现,为什么hardlink这个文件夹在创建后就会有两个链接数呢?
通过上述查看,我们可以看出,当进入hardlink目录下后,默认会有个 .的隐藏目录,而该目录也就是当前目录的意思,即hardlink目录。所以才会有两个链接数。
硬链接的制作中其实还是可能会改变系统的区块,那就是当你新增这条数据却刚好将目录的区块填满时,就可能会新加一个区块来记录文件名关联性,而导致磁盘空间的变化。不过,一般硬链接所用掉的关联数据量很小,所以通常不会改变inode与磁盘空间的大小
1.1.硬链接的缺点
1、无法跨分区,跨设备创建硬链接
[root@localhost hardlink]# ln aa.link /boot/
ln: failed to create hard link ‘/boot/aa.link’ => ‘aa.link’: Invalid cross-device link
因为每个分区都有自己独立的inode体系,
假设A分区的文件在B分区做了一个硬链接,此时访问B分区的此链接,按照我们想的是需要它访问A分区的inode,进行数据查询,但是它只会根据B分区的inode,在B数据块中查找数据。
就相当于两套独立的数据库,你不可能拿着A数据库的某个主键去B数据库搜索数据,是一样的道理。
2、无法创建文件夹/目录的硬链接
至于为何设置为无法创建文件夹,这里还是用反推来验证。
假设可以创建文件夹的硬链接:ln /hardlink /test/dir.link。那么有个问题,首当其冲。
hardlink目录下的 . 是当前目录的意思,此处代表hardlink,那dir.link中的 ‘.’是代表test目录呢?还是 hardlink目录呢?
其次,假设存在目录 /A/B.link 和 /B/A.link。如果B.link是B目录的硬链接,A.link是A目录的硬链接。那A.link既然是/A的链接,那它里面肯定有B.link。同理B.link里面肯定有A.link。这样依次循环 /A/B.link/A.link/B.link/A.link/…。就造成了死循环的现象。这也就是为什么不允许创建文件夹硬链接的原因了。
由于硬链接局限性比较多,所以工作中使用的不多。
2.符号链接(Symbolic Link,亦即是快捷方式)
相对于硬链接,符号链接可就好理解多了。
符号链接相当于我们 Windows 中的快捷方式,即如果你软链接一个目录,只是一个目录的快捷方式到指定位置,操作系统找这个快捷方式会直接找到真实目录下的文件。
基本上,符号链接就是建立一个独立的文件,而这个文件会让数据的读取指向它链接的那个文件的文件名。
由于只是利用文件来做为指向的操作,所以,当源文件被删除之后,符号链接的文件会【打不开了】,会一直说【无法打开某文件】,实际上就是找不到原始文件名而已。
创建软链接
由上图的结果我们可以知道两个文件指向不同的inode号码,当然就是两个独立的文件存在。
而且链接文件的重要内容就是它会写上目标文件的文件名,你可以发现上表中链接文件的大小为6B。因为箭头(-->)右边的文件名【aa.txt】总共有6个字母,每个字母占用1个字节,所以文件大小就是12B了。
但是事实真的是这样子吗?它真的存是是文件名吗?
事实上,软连接记录的是链接文件箭头后面的路径字符串大小
不信的话我们来验证一下
这里我们写入一些内容到aa.txt中
再次查看,原文件大小发生了改变,而链接文件大小依旧没变化。
这其实就是软链接的特性之一,因为软链接的inode指向的数据块保存的是 原文件的路径,如果没有路径,是由文件名,默认会在软链接所在路径查找
再次举例论证
ls.link大小正好是 /usr/bin/ls的路径字符串大小
软链接的使用,如果观察Centos7,会发现,既有使用相对路径创建的软链接,也有使用绝对路径创建的软链接。
而使用相对路径创建软链接,则有如下注意点:上图中,我们使用 ln -s …/aa.txt /tmp/aa.link在/tmp下创建了软链接,却发现,竟然提示报错!找不到aa.txt。
因为/tmp/aa.link在指向…/aa.txt 的过程中。它会以自己的路径为初始点去寻找aa.txt。即 /tmp/aa.link -> …/aa.txt,在系统看来,它会理解成。以aa.link所在路径为起点,回到上一级目录,去寻找aa.txt。很显然没有找到,所以报错。
创建的软连接,指向的文件,默认会以软链接的路径为主,去寻找指向的文件,所以创建时,请以软链接的路径作为起点路径 去写原文件的相对路径
那既然相对路径创建这么麻烦,为什么还要使用这种方式呢?
因为使用相对路径的话,迁移只要相对迁移,不会影响链接的使用,更加灵活。而绝对路径的软链接,则必须要求路径的正确性。
而由于软链接 inode指向的数据块只保存 原文件的地址字符串,所以可以跨分区、跨设备创建,并且文件夹也可以创建。
当然如果原文件被删除了,链接则也会失效,无法向硬链接那样拥有独立性。
基本上,符号链接的用途比较广,所以您要特别留意符号链接的用法,未来一定还会常常用到。
3、软链接与硬链接的区别
- 1、本质:
硬链接:同一个inode,只是多个名字。
软链接:是不同的文件,inode不同
- 2、跨分区
硬链接无法跨分区、跨设备建立,软链接可以
- 3、目录
硬链接无法创建目录硬链接,软链接可以
- 4、相互关系
硬链接没有主次之分,相互独立
软链接依赖于原文件,原文件被删除,软链接即不可用
- 5、链接数
硬链接会删除增加会影响链接数,软链接不会,因为inode不一样。
- 6、相对路径
硬链接创建时,原始文件路径是相对于当前路径。
软链接创建时,原始文件路径是 相对于软链接的路径
- 7、文件类型
硬链接的类型与原始文件类型一致,软链接则会显示 symbolic link
- 8、创建方式
硬链接创建:ln [原文件] [硬链接]
软链接创建:ln -s [原文件] [软链接]
4.关于目录的链接数量
或许您已经发现了,那就是,当我们以硬链接进行文件的链接时,可以发现,在ls-l所显示的第二字段会增加一才对,那么请教,如果建立目录时,它默认的链接数量会是多少?
让我们来想一想,一个空目录里面至少会存在些什么?
呵呵,就是存在.与..这两个目录。
那么,当我们建立一个新目录名称为/tmp/testing时,基本上会有三个东西,那就是:
- /tmp/testing
- /tmp/testing/.
- /tmp/testing/..
而其中/tmp/testing与/tmp/testing/.其实是一样的。都代表该目录,而/tmp/testing/.则代表/tmp 这个目录。所以说,当我们建立一个新的目录时,【新的目录的链接数为2,而上层目录的链接数则会增加1】
不信的话,我们来做个测试看看:
看,原本的所谓上层目录/tmp的链接数量由10增加为11,至于新目录/tmp/testing则为2。这
样可以理解目录链接数量的意义了吗?