• Python 中的迭代器(iter、next)与生成器(yield)解析


    Python 中的迭代器(Iterator)是一个可以记住遍历位置的对象,用于迭代列表、元组、字典、集合和字符串等可迭代(Iterable)对象迭代器从集合的第一个元素开始访问,直到所有的元素被访问完结束,并且只能往前不会后退。使用 collections.abc 库中的 Iterable 和 Iterator 可以判断对象是否可迭代和是否为迭代器。

    >>> from collections.abc import Iterable
    >>> isinstance([], Iterable)
    True
    >>> isinstance({}, Iterable)
    True
    >>> isinstance('abc', Iterable)
    True
    >>> isinstance(100, Iterable)
    False
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    >>> from collections.abc import Iterator
    >>> isinstance([], Iterator)
    False
    >>> isinstance({}, Iterator)
    False
    >>> isinstance('abc', Iterator)
    False
    >>> isinstance(iter([]), Iterator)
    True
    >>> isinstance(iter('abc'), Iterator)
    True
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    正如上面代码所示,列表、字典和字符串都是可迭代的,而数字就不是可迭代的。但列表、字典和字符串都不是迭代器,因为可迭代的对象(如列表、元组、字典、集合和字符串),得先使用 iter() 方法把它们初始化为迭代器对象之后,才能使用 next() 方法对其进行迭代。所以 iter([])iter('abc') 都是迭代器。

    有了迭代器之后,就可以用 next() 方法对其进行迭代,如果迭代器的内容已经全部迭代完了,就会返回一个 StopIteration 的错误:

    >>> list=[1, 2, 3, 4]
    >>> it = iter(list)    # 创建迭代器对象
    >>> print (next(it))   # 输出迭代器的下一个元素
    1
    >>> print (next(it))
    2
    >>> print (next(it))
    3
    >>> print (next(it))
    4
    >>> print (next(it))
    Traceback (most recent call last):
      File "", line 1, in <module>
    StopIteration
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    不断地调用 next() 方法显然太麻烦了,最简洁的方法是使用 for 循环

    >>> for i in [1, 2, 3, 4]:
    ...     print(i)
    ... 
    1
    2
    3
    4
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    注意 for 循环接收的只是可迭代对象而不是迭代器,所以实际上 for 循环帮我们同时完成了 iter()next() 方法,并且在遇到 StopIteration 就会自动退出循环。以下代码和上面是等价的:

    it = iter([1, 2, 3, 4, 5])  # 创建迭代器对象
    # 循环:
    while True:
        try:
            i = next(it)  # 输出迭代器的下一个元素
            print(i)
        except StopIteration:  # 遇到StopIteration就退出循环
            break
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    说完迭代器,就轮到生成器了。所谓生成器(generator) 就是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器

    生成器(函数)有两种写法,第一种是类似于列表生成式(推导式) 的写法,只不过把列表的中括号换成小括号而已:

    >>> f = (x * x for x in range(10))
    >>> f
    <generator object <genexpr> at 0x1022ef630>
    
    • 1
    • 2
    • 3

    f 就是一个迭代器,其函数为求平方,所以能使用 next() 方法进行迭代:

    >>> next(f)
    0
    >>> next(f)
    1
    >>> next(f)
    4
    >>> next(f)
    9
    >>> next(f)
    16
    >>> next(f)
    25
    >>> next(f)
    36
    >>> next(f)
    49
    >>> next(f)
    64
    >>> next(f)
    81
    >>> next(g)
    Traceback (most recent call last):
      File "", line 1, in <module>
    StopIteration
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24

    同样地,用 for 循环既然能处理可迭代对象,当然也可以处理迭代器,如下

    >>> f = (x * x for x in range(10))
    >>> for i in f:
    ...     print(i)
    ... 
    0
    1
    4
    9
    16
    25
    36
    49
    64
    81
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    第二种生成器的写法,就是在创建函数时使用 yield 关键字,假设我们想输出指定长度的斐波拉契数列,有如下函数:

    def fib(max):
        n, a, b = 0, 0, 1
        while n < max:
            print(b)
            a, b = b, a + b
            n = n + 1
        return 'done'
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    调用函数如下:

    >>> fib(6)
    1
    1
    2
    3
    5
    8
    'done'
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    只需要把函数中的 print 改为 yield,该函数就变成了生成器函数:

    def fib(max):
        n, a, b = 0, 0, 1
        while n < max:
            yield b
            a, b = b, a + b
            n = n + 1
        return 'done'
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    调用生成器函数就会得到一个生成器,实际上也就是迭代器:

    >>> f = fib(6)
    >>> f
    <generator object fib at 0x104feaaa0>
    
    • 1
    • 2
    • 3

    所以用 for 循环进行迭代可以得到如下结果:

    >>> for i in f:
    ...     print(i)
    ... 
    1
    1
    2
    3
    5
    8
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    生成器函数普通函数的执行流程不一样。普通函数是顺序执行,遇到 return 语句或者最后一行函数语句就返回。而变成生成器的函数,在每次调用 next() 的时候执行,遇到 yield 语句返回,再次执行时从上次返回的 yield 语句处继续执行。

    最后作个总结:

    • 迭代器一定是可迭代的,但集合数据类型如列表、字典、字符串等是可迭代的但不是迭代器,可以通过 iter() 函数获得一个迭代器对象;
    • 凡是可作用于 for 循环的对象都是可迭代的
    • 凡是可作用于 next() 函数的对象都是迭代器,它们表示一个惰性计算的序列;
    • Python 的 for 循环如果接收到还不是迭代器可迭代的对象,就会调用 iter() 将其变成迭代器,然后不断调用 next() 函数实现迭代过程;
    • 生成器就是可以让我们通过编写函数,自定义得到的迭代器
  • 相关阅读:
    面试官:为什么忘记密码要重置而不是告诉你原密码?
    RabbitMQ学习笔记——声明队列和交换机的方式(Config配置方式)
    Zabbix监控系统PHP-API开发测试实录
    监控摄像头连接NAS,实现监控管理一体化
    ‘face_alignment‘ has no attribute ‘FaceAlignment‘
    英语语法强化
    C语言学习-数组(4)
    Fisher-Yates scrambling是如何实现的
    Apache Doris 系列: 基础篇-安装部署
    Linux环境redis外网连接配置
  • 原文地址:https://blog.csdn.net/cnhwl/article/details/126355842