抖音资讯

douyinzx

python遍历目录下所有文件(python循环读取文件夹之中的文件)

iseeyu2年前 (2024-05-07)抖音资讯153

Python 对于文件夹或者文件的遍历一般有两种操作方法,一种是至二级利用其封装好的 walk 方法操作:


import os
for root,dirs,files in os.walk("/Users/cxhuan/Downloads/globtest/hello"):
    for dir in dirs:
        print(os.path.join(root, dir))
    for file in files:
        print(os.path.join(root, file))

上面代码运行结果如下:

/Users/cxhuan/Downloads/globtest/hello/world
/Users/cxhuan/Downloads/globtest/hello/.DS_Store
/Users/cxhuan/Downloads/globtest/hello/hello3.txt
/Users/cxhuan/Downloads/globtest/hello/hello2.txt
/Users/cxhuan/Downloads/globtest/hello/hello1.txt
/Users/cxhuan/Downloads/globtest/hello/world/world1.txt
/Users/cxhuan/Downloads/globtest/hello/world/world3.txt
/Users/cxhuan/Downloads/globtest/hello/world/world2.txt

上述程序,将 os.walk 读取到的所有路径 root 、目录名 dirs 与文件名 files ,也就是三个文件数组利用 foreach 循环输出。join方法就是将其路径与目录名或者文件名连接起来,组成一个完整的目录。

另一种是用递归的思路,写成下面的形式:


import os
files = list()
def dirAll(pathname):
    if os.path.exists(pathname):
        filelist = os.listdir(pathname)
        for f in filelist:
            f = os.path.join(pathname, f)
            if os.path.isdir(f):
                dirAll(f)
            else:
                dirname = os.path.dirname(f)
                baseName = os.path.basename(f)
                if dirname.endswith(os.sep):
                    files.append(dirname+baseName)
                else:
                    files.append(dirname+os.sep+baseName)


dirAll("/Users/cxhuan/Downloads/globtest/hello")
for f in files:
    print(f)

运行上面代码,得到的结果和上面一样。

这两种方法都没问题,就是写起来比较麻烦,特别是第二种,一不小心还有可能写出 bug 。

今天我们来介绍第三种方法——利用 glob 模块来遍历文件。

简介

glob 是 python 自带的一个操作文件的模块,以简洁实用著称。由于这个模块的功能比较简单,所以也很容易上手和使用。它主要用来查找符合特定规则的文件路径。使用这个模块来查找文件,只需要用到*?[] 这三个匹配符:

python遍历目录下所有文件(python循环读取文件夹之中的文件)

 * : 匹配0个或多个字符;
 ? : 匹配单个字符;
 [] :匹配指定范围内的字符,如:[0-9]匹配数字。

glob.glob 方法

glob.glob 方法主要返回所有匹配的文件路径列表。它只有一个参数 pathname ,定义了文件路径匹配规则,这里可以是绝对路径,也可以是相对路径。

使用 * 匹配

我们可以用 * 匹配零个或者多个字符。

输出目录下的子目录或者文件:


for p1 in glob.glob('/Users/cxhuan/Downloads/globtest/*'):
    print(p1)

运行上面代码,会将 globtest 文件夹下仅有的目录输出出来,输出内容如下:


/Users/cxhuan/Downloads/globtest/hello

我们也可以通过制定层级来遍历文件或者文件夹:


for p in glob.glob('/Users/cxhuan/Downloads/globtest/*/*'):
    print(p)

上面的代码会遍历 globtest 文件夹以及子文件夹,将所有的文件或文件夹路径打印出来:

/Users/cxhuan/Downloads/globtest/hello/world
/Users/cxhuan/Downloads/globtest/hello/hello3.txt
/Users/cxhuan/Downloads/globtest/hello/hello2.txt
/Users/cxhuan/Downloads/globtest/hello/hello1.txt

我们也可以对文件或者文件夹进行过滤:


for p in glob.glob('/Users/cxhuan/Downloads/globtest/hello/*3.txt'):
    print(p)

上面代码值匹配 hello 目录下的文件名末尾为 ‘3’ 的 txt 文件,运行结果如下:

/Users/cxhuan/Downloads/globtest/hello/hello3.txt

使用 ? 匹配

我们可以用问号(?)匹配任何单个的字符。


for p in glob.glob('/Users/cxhuan/Downloads/globtest/hello/hello?.txt'):
    print(p)

上面的代码输出 hello 目录下的以 ‘hello’ 开头的 txt 文件,输出结果如下:


/Users/cxhuan/Downloads/globtest/hello/hello3.txt
/Users/cxhuan/Downloads/globtest/hello/hello2.txt
/Users/cxhuan/Downloads/globtest/hello/hello1.txt

使用 [] 匹配

我们可以使用 [] 来匹配一个范围:


for p in glob.glob('/Users/cxhuan/Downloads/globtest/hello/*[0-2].*'):
    print(p)

我们想要得到 hello 目录下的文件名结尾数字的范围为 0到2的文件,运行上面代码,获得的输出为:

/Users/cxhuan/Downloads/globtest/hello/hello2.txt
/Users/cxhuan/Downloads/globtest/hello/hello1.txt

glob.iglob 方法

python 的 glob 方法可以对文件夹下所有文件进行遍历,并返回一个 list 列表。而 iglob 方法一次只获取一个匹配路径。下面是一个简单的例子来说明二者的区别:

p = glob.glob('/Users/cxhuan/Downloads/globtest/hello/hello?.*')
print(p)

print('----------------------')

p = glob.iglob('/Users/cxhuan/Downloads/globtest/hello/hello?.*')
print(p)

运行上面代码,结果返回是:


['/Users/cxhuan/Downloads/globtest/hello/hello3.txt''/Users/cxhuan/Downloads/globtest/hello/hello2.txt''/Users/cxhuan/Downloads/globtest/hello/hello1.txt']
----------------------
<generator object _iglob at 0x1040d8ac0>

从上面的结果我们可以很容易看到二者的区别,前者返回的是一个列表,后者返回的是一个可迭代对象。

我们针对这个可迭代对象做一下操作看看:

p = glob.iglob('/Users/cxhuan/Downloads/globtest/hello/hello?.*')
print(p.__next__())
print(p.__next__())

运行结果如下:

/Users/cxhuan/Downloads/globtest/hello/hello3.txt
/Users/cxhuan/Downloads/globtest/hello/hello2.txt

我们可以看到,针对这个可迭代对象,我们一次可以获取到一个元素。这样做的好处是节省内存,试想如果一个路径下有大量的文件夹或者文件,我们使用这个迭代对象不用一次性全部获取到内存,而是可以慢慢获取。

扫描二维码推送至手机访问。

版权声明:本文由西安泽虎代运营发布,如需转载请注明出处。

转载请注明出处https://www.0291.com.cn/post/42936.html

相关文章

医美行业丨「新年焕颜季」主题活动,等你来! | 百度广告投放平台

医美行业丨「新年焕颜季」主题活动,等你来! | 百度广告投放平台

一、一重好礼:搜索活动主题会场 ●通过百度广告投放平台、百度APP资源、健康频道、搜索产品、站内/外等平台的资源曝光导流到活动页,首页坑位展示综合贡献度TOP客户,位置有限,先到先得,详情页展示全部客户。 二、二重好礼:搜索活动主题会场 ●通过达人进行百度广告营销、文案植入...

快手直投引流怎样放量?快手信息流广告怎么开户快呢?

快手直投引流怎样放量?快手信息流广告怎么开户快呢?

放量加速 计划需提前半小时左右开启,直播间同步开启,在冷启动的半小时可以在镜头前拜访大幅海报/画板/倒计时等(类似手机发布会),如果客户要求尽可能多引入观众,正常使用磁力引擎下帮助加速通过冷启动和放量的优化类产品。 使用自动出价+一键起量(白名单阶段,需单独申请);  不使用自动出价...

小红书和抖音的区别

小红书和抖音的区别

抖音和小红书是人们生活中常用的社交短视频平台。抖音和小红书在很多方面都有差异,那么我们应该如何根据这些差异来选择呢?小红书和抖音的区别有哪些?   抖音是一款由今日头条孵化的音乐创意短视频社交软件。用户可以选择歌曲和短视频来形成自己的作品。小红皮书是一个生活方式...

爱剪辑mac版本怎么用(苹果电脑imovie剪辑教程)

爱剪辑mac版本怎么用(苹果电脑imovie剪辑教程)

 爱剪辑可谓是一款革旧鼎新的剪辑视频软件了,并且页面非常人性化,小白也能一看就会,上手超级容易,省去了大量的学习时间,操作简单而且响应迅速,运行速度那是没的说,真正做到了快速视频剪辑。   爱剪辑的操作步骤也是非常简单的,下面就跟小编一起来学习一下。   步骤一:视频快速添加   添加视...

快手广告案例|美妆行业达人营销「种养拔」三步曲

快手广告案例|美妆行业达人营销「种养拔」三步曲

如果婚礼当天,你的妆容由影后杨紫琼、巩俐、章子怡的御用化妆师李东田来设计,会是怎样的情况?不止你好奇,快手上有1300W+的观看用户同样好奇。一场由专业带货主播安九和明星化妆师李东田带来的美妆快手直播广告,带来了高达2000W+的GMV,由此拉开了达播共创快手广告推广的序幕。 Kbeauty快...

广告产品如何通过快手进行推广?

广告产品如何通过快手进行推广?

快手是一款资讯类的软件,能够通过数据算法分析对用户实现个性化推荐,从而将用户需求的,有价值的信息展现在用户面前,从而将用户与信息连接起来,那么,如果是广告产品,怎样通过快手来推广?特点又是怎样的?下文为您具体讲解。 1、快手广告平台的特点是怎样的? 首先在快手做推广,覆盖面积广泛,能够触...

现在,非常期待与您的又一次邂逅

我们努力让每一部企业宣传片和抖音短视频成为商业大片