find linux 目录深度_浪里淘沙,详解Linux系统中Find命令的实用技巧

知了小巷:浪里淘沙,详解Linux系统中Find命令的实用技巧。

5ba31cfbca01e982e5ee792802f08667.png

啊哈,找到了!

当我们需要在Linux系统上定位某个文件或目录时,find命令通常是必备之选。

它使用起来非常简单,但有许多不同的可选项,允许我们对要搜索的文件进行条件过滤。 下面的实例,将会展示如何使用find命令查找系统上的任何我们想要查找的内容。一旦我们知道如何在Linux中使用find命令,每个文件都只需要敲几下键盘就搞定了。

753a84e00dfa71edb8ed33525b281e08.png

finding...

Linux 系统实验版本:

$ cat /proc/version

Linux version 3.10.0-957.1.3.el7.x86_64 (mockbuild@kbuilder.bsys.centos.org) (gcc version 4.8.5 20150623 (Red Hat 4.8.5-36) (GCC) ) #1 SMP Thu Nov 29 14:49:43 UTC 2018

1. 查找目录

find命令后跟-type d选项,这将会使find只搜索目录而忽略文件。

$ find /path/to/search -type d -name "name-of-dir"

$ find / -type d -name 'home'

/home/admin/escheduler-ui/dist.old/css/home

/home/admin/escheduler-ui/dist.old/js/home

/home/admin/escheduler-ui/dist.20191112/css/home

/home/admin/escheduler-ui/dist.20191112/js/home

/home/admin/escheduler-ui/dist/css/home

/home/admin/escheduler-ui/dist/js/home

2. 查找隐藏文件

$ find /path/to/search -name ".*"

$ find ~/ -name ".*"

/home/admin/.trash/.py3_monitor_yarn_flinkjobs.py

/home/admin/.sqlline

/home/admin/.bash_profile

/home/admin/.ansible

3. 查找超过指定大小的文件

需要用到-size选项

查找超过10MB大小的文件:

$ find /path/to/search -size +10M

$ find ~/ -size +10M

/home/admin/hive.zip

/home/admin/flink-1.7.2.zip

查找小于10MB大小的文件:

$ find /path/to/search -size -10M

$ find ~/ -size -10M

/home/admin/tt.sh

/home/admin/ss.sh

/home/admin/send_email.py

查找刚刚好10MB大小的文件:

$ find /path/to/search -size 10M

$ find ~/ -size 10M

/home/admin/elk/elasticsearch-6.2.3/lib/elasticsearch-6.2.3.jar

查找介于100MB到2GB大小之间的文件:

$ find /path/to/search -size +100M -size -2G

$ find ~/ -size +100M -size -2G

/home/admin/streamsets-datacollector-3.11.0/libexec/bootstrap-libs/cluster/streamsets-datacollector-mesos-bootstrap-3.11.0.jar

4. 查找指定文件中文件名列表的一个或多个文件

需要用到管道符grep;查找结果是非精确文件名。

$ find /path/to/search | grep -f filelist.txt

$ echo tt.sh > shlist.txt

$ echo ss.sh >> shlist.txt

$ find ~/ | grep -f shlist.txt

/home/admin/elk/kibana-7.3.0-linux-x86_64/data/headless_shell-linux

/home/admin/elk/kibana-7.3.0-linux-x86_64/data/headless_shell-linux/headless_shell

/home/admin/tt.sh

/home/admin/ss.sh

需要注意的是文件名称中的“点”-. 会被忽略,下同:

$ echo 'tt.sh' > shlist2.txt

$ echo 'ss.sh' >> shlist2.txt

$ find ~/ | grep -f shlist2.txt

/home/admin/elk/kibana-7.3.0-linux-x86_64/data/headless_shell-linux

/home/admin/elk/kibana-7.3.0-linux-x86_64/data/headless_shell-linux/headless_shell

/home/admin/tt.sh

/home/admin/ss.sh

如果文件名称由单引号,会什么都找不到,单引号也是文件名称的一部分了:

$ echo "'tt.sh'" > shlist3.txt

$ echo "'ss.sh'" >> shlist3.txt

$ find ~/ | grep -f shlist3.txt

那怎样做才能精确找到与shlist.txt所列出的文件名称一模一样的文件呢???

答案是在文件名中的“点”前面加上转义字符"":

$ echo 'tt.sh' > shlist4.txt

$ echo 'ss.sh' >> shlist4.txt

$ find ~/ | grep -f shlist4.txt

/home/admin/tt.sh

/home/admin/ss.sh

5. 查找不在指定文件名列表范围内的文件

-v的意思是“inverse match“即反向匹配。

$ find /path/to/search | grep -vf filelist.txt

$ find ~/ | grep -vf shlist4.txt

/home/admin/shlist.txt

/home/admin/shlist3.txt

/home/admin/shlist2.txt

/home/admin/shlist4.txt

6. 设置查找的深度-maxdepth

find命令默认情况下会递归查找文件夹和子文件夹,所有子文件夹都会查找一遍。

我们可以使用-maxdepth选项来指定递归查找的文件夹层次数。

如果是当前文件夹下面,参数设置为0,如果是当前文件夹+子文件夹+子子文件夹,参数设置为2,以此类推。

$ find . -maxdepth 0 -name "myfile.txt"

$ find ~/ -maxdepth 2 -name "shlist.txt"

/home/admin/shlist.txt

7. 查找空文件

使用empty选项。

$ find /path/to/search -type f -empty

$ find ~/ -type f -empty

/home/admin/hive-2.3.5/examples/files/empty1.txt

/home/admin/hive-2.3.5/examples/files/empty2.txt

/home/admin/hive-2.3.5/examples/files/nullfile.txt

查找空文件夹:

$ find /path/to/search -type d -empty

$ find ~/ -type d -empty

/home/admin/nginx/srcnginx

/home/admin/.npm/_cacache/tmp

/home/admin/.npm/_locks

如果想要一次性删除空文件,可以使用-delete选项:

$ find /path/to/search -type f -empty -delete

8. 查找最大或比较大的文件夹或文件

$ find /path/to/search -type f -printf "%s%p" | sort -n | tail -1

$ find ~/ -type f -printf "%s%p" | sort -n | tail -1

1077105823 /home/admin/flink-1.7.2.zip

使用sort对文件的size进行排序,使用tail输出排在前面的n个文件。

文件输出的顺序,是从小到大。

如果要查找最小或topN小的文件,使用head就可以了:

$ find ~/ -type f -printf "%s%p" | sort -n | tail -5

268435627 /home/admin/hadoop-2.8.5/logs/hadoop-admin-namenode-testbi-flink-72.zlxx.local.log.6

268435631 /home/admin/hadoop-2.8.5/logs/hadoop-admin-namenode-testbi-flink-72.zlxx.local.log.3

284513057 /home/admin/elk/elasticsearch-7.3.0-linux-x86_64.tar.gz

301452104 /home/admin/test/flink-1.7.2-bin-hadoop28-scala_2.11.tgz

1077105823 /home/admin/flink-1.7.2.zip

查找最大的文件夹,未递归包括子文件夹下文件的大小:

$ find /path/to/search -type d -printf "%s%p" | sort -n | tail -1

$ find ~/ -type d -printf "%s%p" | sort -n | tail -1

344064 /home/admin/elk/kibana-7.3.0-linux-x86_64/built_assets/.cache/ui_bundles/babel

9. 查找普通用户能够使用root权限执行的文件

setuid:"set user ID on execution" ,普通用户能够使用root权限执行的文件。

SUID:SUID权限仅对二进制程序(binary program)有效;执行者对于该程序需要具有x的可执行权限;本权限仅在执行该程序的过程中有效(run-time);执行者将具有该程序拥有者(owner)的权限。

SUID的目的是:让本来没有相应权限的用户运行这个程序时,可以访问他没有权限访问的资源。

有两个选项:-user和-perm;-exec ls -l {} ;会输出更多信息。

# find /path/to/search -user root -perm /4000

# find / -user root -perm /4000

/usr/bin/mount

/usr/bin/su

/usr/bin/passwd

...

# find /path/to/search -user root -perm /4000 -exec ls -l {} ;

# find / -user root -perm /4000 -exec ls -l {} ;

-rwsr-xr-x 1 root root 44320 Oct 31 2018 /usr/bin/mount

-rwsr-xr-x 1 root root 32208 Oct 31 2018 /usr/bin/su

-rwsr-xr-x. 1 root root 27832 Jun 10 2014 /usr/bin/passwd

...

不指定用户:

$ find /path/to/search -perm /4000

10. 查找设置了SGID的文件

SGID:SGID对二进制程序有用;程序执行者对于该程序来说,需具备x的权限;SGID主要用在目录上。

和SUID一样,只是SGID是获得该程序所属用户组的权限。

例如:如果用户在此目录下具有w权限的话,若使用者在此目录下建立新文件,则新文件的群组与此目录的群组相同。

# find /path/to/search -perm /2000

# find / -perm /2000 -exec ls -l {} ;

-r-xr-sr-x. 1 root tty 15344 Jun 10 2014 /usr/bin/wall

-rwxr-sr-x 1 root tty 19624 Oct 31 2018 /usr/bin/write

---x--s--x 1 root nobody 382240 Apr 11 2018 /usr/bin/ssh-agent

...

设置了SUID或SGID的文件,结果看并不一定是同时满足:

# find /path/to/search -perm /6000

# find / -perm /6000 -exec ls -l {} ;

---s--x--x 1 root root 147392 Oct 31 2018 /usr/bin/sudo

-rwsr-xr-x 1 root root 44320 Oct 31 2018 /usr/bin/mount

-rwsr-xr-x 1 root root 32208 Oct 31 2018 /usr/bin/su

-rwsr-xr-x 1 root root 32048 Oct 31 2018 /usr/bin/umount

-rwxr-sr-x 1 root tty 19624 Oct 31 2018 /usr/bin/write

11. 查找文件输出的时候过滤掉"Permission denied"的文件

$ find / -name "myfile.txt" 2>%1 | grep -v "Permission denied"

# find / -name "ss.sh" 2>%1 | grep -v "Permission denied"

/home/admin/ss.sh

12. 查找最近一段时间内发生过变更的文件

-mtime选项指定一定天数。

最近30天:

$ find /path/to/search -type f -mtime -30

$ find ~/ -type f -mtime -30

/home/admin/.bash_history

/home/admin/flink-1.7.2/log/flink-admin-client-testbi-flink-72.zlxx.local.log

超过30天,就多啦:

$ find /path/to/search -type f -mtime +30

$ find ~/ -type f -mtime +30

/home/admin/.bash_profile

/home/admin/hive.zip

刚刚好30天,且输出更多文件信息:

$ find /path/to/search -type f -mtime 30

$ find ~/ -type f -mtime 30 -exec ls -l {} ;

-rw-rw-r-- 1 admin admin 2864754 Dec 9 16:51 /home/admin/apache-cassandra-3.0.18/logs/system.log

-rw-rw-r-- 1 admin admin 1841736 Dec 9 16:51 /home/admin/apache-cassandra-3.0.18/logs/gc.log.0.current

-rw-rw-r-- 1 admin admin 7550190 Dec 9 16:51 /home/admin/apache-cassandra-3.0.18/logs/debug.log

13. 根据文件变更时间进行排序

$ find /path/to/search -printf "%T+%p" | sort

$ find ~/ -type f -mtime 30 -printf "%T+%p" | sort

2019-12-09+16:51:04.9282457790 /home/admin/apache-cassandra-3.0.18/logs/system.log

2019-12-09+16:51:04.9392455540 /home/admin/apache-cassandra-3.0.18/logs/debug.log

2019-12-09+16:51:05.2652388850 /home/admin/apache-cassandra-3.0.18/logs/gc.log.0.current

默认是从小到达,也就是业界标准ASC,如果想要DESC:

$ find ~/ -type f -mtime 30 -printf "%T+%p" | sort -r

2019-12-09+16:51:05.2652388850 /home/admin/apache-cassandra-3.0.18/logs/gc.log.0.current

2019-12-09+16:51:04.9392455540 /home/admin/apache-cassandra-3.0.18/logs/debug.log

2019-12-09+16:51:04.9282457790 /home/admin/apache-cassandra-3.0.18/logs/system.log

14. find命令与locate命令的区别

默认情况下,Linux系统并没有locate命令:

$ locate ss.sh

-bash: locate: command not found

Linux locate命令用于查找符合条件的文档,他会去保存文档和目录名称的数据库内,查找合乎范本样式条件的文档或目录。

一般情况我们只需要输入 locate your_file_name 即可查找指定文件。

locate与find 不同: find 是去硬盘找,locate 只在/var/lib/slocate资料库中找。

locate的速度比find快,它并不是真的查找,而是查数据库,一般文件数据库在/var/lib/slocate/slocate.db中,所以locate的查找并不是实时的,而是以数据库的更新为准,一般是系统自己维护,也可以手工升级数据库 。

如果需要使用locate,可以进行以下操作:

# yum install mlocate -y

...

Installed:

mlocate.x86_64 0:0.26-8.el7

Complete!

# updatedb

$ locate ss.sh

/etc/profile.d/less.sh

/home/admin/ss.sh

类似like '%ss.sh'。

15. find命令执行时的CPU负载如何呢?

可以通过top命令监控find占用的资源情况,如果find的目录比较多比较深的时候。

使用ionice命令可以优化减少IO资源的使用:

$ ionice -c3 -n7 find /path/to/search -name "myfile.txt"

$ ionice -c3 -n7 find ~/ -type f -mtime 30 -printf "%T+%p" | sort -r

ionice: ignoring given class data for idle class

2019-12-09+16:51:05.2652388850 /home/admin/apache-cassandra-3.0.18/logs/gc.log.0.current

2019-12-09+16:51:04.9392455540 /home/admin/apache-cassandra-3.0.18/logs/debug.log

2019-12-09+16:51:04.9282457790 /home/admin/apache-cassandra-3.0.18/logs/system.log

使用nice命令可以优化减少CPU资源的使用:

$ nice -n 19 find /path/to/search -name "myfile.txt"

$ nice -n19 find ~/ -type f -mtime 30 -printf "%T+%p" | sort -r

2019-12-09+16:51:05.2652388850 /home/admin/apache-cassandra-3.0.18/logs/gc.log.0.current

2019-12-09+16:51:04.9392455540 /home/admin/apache-cassandra-3.0.18/logs/debug.log

2019-12-09+16:51:04.9282457790 /home/admin/apache-cassandra-3.0.18/logs/system.log

IO和CPU同时优化:

$ nice -n ionice -c2 -n7 find /path/to/search -name "myfile.txt"

【202001】

80331d34d348a6d0f61f6f89d51da2ef.png

end

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/443646.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

剑指offer之从上到下打印二叉树

从上到下打印出二叉树的每个节点,同一层的节点按照从左到右的顺序打印。 例如: 给定二叉树: [3,9,20,null,null,15,7], 返回: [3,9,20,15,7] 来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problem…

小米真蓝牙耳机说明书_小米真无线蓝牙耳机Air2 SE评测:仅需169元,享受随心畅听体验...

继小米真无线蓝牙耳机Air 2、小米真无线蓝牙耳机Air 2S之后,小米公司又于2020年5月19日再次推出了一款售价更为亲民的真无线蓝牙耳机新品——小米真无线蓝牙耳机Air2 SE,该机不仅延续了小米真无线蓝牙耳机Air 2系列的外观设计,支持开盒弹窗、…

引用与指针的区别

虽然指针和引用都可以完成对其他对象的间接访问,但是还是有很多不同之处: 1.本身是否是对象 指针本身就是一个对象,而引用本身不是一个对象。因此允许对指针赋值和拷贝,可以定义对指针的引用,已经指向指针的指针&#…

三点外接圆_故地重游伪切圆——伪外接圆的基本性质

在思考一个有关于伪外接圆的等角线问题时,我回想起伪外接圆的一道小题目,这是2012年罗马尼亚大师杯的第六题,这道题目直接以结论的形式呈现出了伪外接圆的基本性质,是一道入门伪外接圆必做的精巧小题。当然有些读者可能从未见过&q…

C++的const限定符

const限定符总是让人很头疼,下面讲解一下几个比较容易混淆的概念: 对常量的引用(常量引用): 一般情况下,引用的类型要与其所引用的对象的类型一致,其中的例外情况就是,当初始化常量…

Linux学习:第五章-Linux用户和用户组管理

一用户管理命令用户信息文件:/etc/passwd aa:x:501:501::/home/aa:/bin/bash 第一列:用户名 第二列:密码标志 第三列:UID用户ID 0管理员 1-499系统用户(伪用户) 500普通用户 第四列:GID初始组ID…

一点等于多少厘米_马桶知识介绍,你了解马桶多少

我们可能并不了解我们经常运用的马桶,认为马桶便是简简单单的规划,没什么技术含量。其实不然,马桶的规划也包含了不少物理学原理。假如你家里的马桶出现毛病,首先要排查毛病的原因,但是假如不了解马桶结构图那就很难把…

动态内存分配与智能指针

内存分配: 静态存储区: 局部static对象类的static数据成员定义在任何函数之外的变量 栈区: 函数内的非static对象 动态内存分配的方式有: new和delete智能指针(shared_ptr、unique_ptr、weak_ptr)all…

1151压力变送器型号_日本进口横河EJA530E压力变送器型号解读!

横河EJA变送器对大家来说也许不陌生,但是对于EJA变送器的型号很多人还不是很懂,因为一个全型号代表这很多参数,每一个字母和每一个数字背后都是一个准确的参数,我们在选型的时候要提供必要的参数,更具参数选出合适的型…

plc控制可调节阀流程图_PLC控制的水箱液位控制系统毕业论文

内容介绍原文档由会员 莎士比亚 发布论文标准WORD格式排版40页摘要在人们生活以及工业生产等诸多领域经常涉及到液位和流量的控制问题, 例如居民生活用水的供应, 饮料、食品加工, 溶液过滤, 化工生产等多种行业的生产加工过程, 通常需要使用蓄液池, 蓄液池中的液位需要维持合适…

idea继承后重新方法快捷键_idea 查看类继承关系的快捷键

类似eclipse ctrlt的快捷键,idea中是ctrlH…找到对应的类 查看类关系图…1.在想要查看的类上按 Ctrl H -> Diagrams -> Show Diagrams -> Java Class Diagrams -> Show Implementations -> Ctrl A -> 右击一下 -> Enter .…打开想要查看的接口或者类文件…

怎样在数组末尾添加数据_如何利用C++实现可变长的数组?

应该执行什么功能?假设我们要实现一个将自动扩展的数组类,是否需要实现函数?让我们从下面主要功能使用的功能开始,看看我们需要实现哪些功能。输出结果:0 1 2 3 40 1 2 100 4您需要做什么才能实现上述功能?…

Linux学习:第六章-Linux服务和进程管理

一进程查看 1psaux查看当前系统所有运行的进程 -a显示前台所有进程 -u显示用户名 -x显示后台进程 user: 用户名 pid:进程id。PID1init系统启动的第一个进程 %CPUcpu占用百分比 %MEM内存占用百分比 VSZ虚拟内存占用量KB RSS固定内存占有量 tty登录终端tty…

覆盖索引与联合索引_浅析MySQL的索引覆盖和索引下推

写在前面在MySQL数据库中,索引对查询的速度有着至关重要的影响,理解索引也是进行数据库性能调优的起点,索引就是为了提高数据查询的效率。今天我们来聊聊在MySQL索引优化中两种常见的方式,索引覆盖和索引下推索引覆盖要了解索引覆…

python3 输入输出_Python3基础之输入和输出实例分析

通常来说,一个Python程序可以从键盘读取输入,也可以从文件读取输入;而程序的结果可以输出到屏幕上,也可以保存到文件中便于以后使用。本文就来介绍Python中最基本的I/O函数。一、控制台I/O1.读取键盘输入内置函数input([prompt])&…

redis 哨兵 异步_突破Java面试(23-8) - Redis哨兵主备切换的数据丢失问题-阿里云开发者社区...

1 数据丢失的两个场景主备切换的过程,可能会导致数据丢失1.1 异步复制由于 master > slave的复制是异步的,所以可能有部分数据还没复制到slave,master就宕机,于是这些数据就丢失了1.2 脑裂导致脑裂,也就是说&#x…

vue 断开正在发送的请求_vue 发送请求频繁时取消上一次请求

前言:在项目中经常有一些场景会连续发送多个请求,而异步会导致最后得到展示的结果可能不是最后一次发送请求返回的结果,且对性能也有非常大的影响。场景:列表式切换商品,有时候上一次请求的结果非常慢,而我…

Linux学习:第六章-Linux网络配置

上一章的补充: 常见网络端口: 2021ftp服务文件共享 22ssh服务安全远程网络管理 23telnet服务 25smtp:简单邮件传输协议发信 110pop3:邮局协议收信 80www网页服务 3306mysql端口 3389windows终端服务 53DNS端口 /etc/services所有系…

sequelize 增加数据库字段_Node项目使用Sequelize操作数据库(一)(包括模型,增,删、改等)...

Sequelize 是一个基于 Promise 的 Node.js ORM,目前支持 Postgres、MySQL、SQLite 和 Microsoft SQL Server。它具有强大的事务支持,关联关系、读取和复制等功能。所谓ORM是指对象关系映射,通过使用描述对象和数据库之间映射的元数据&#xf…

django orm插入一条_如何通过django的ORM远程发布文章?

利用django的ORM可以方便的给数据库插入文章但是假如我django放在阿里云,那我想在本地写个插件,每天很方便的插入一些数据,最好是通过ORM的,因为管理起来比较方便,会涉及到多个站,可能会有200多个站&#x…