概念
iterable -- 可迭代对象
能够逐一返回其成员项的对象??傻韵蟮睦影ㄋ行蛄欣嘈停ɡ?list、str 和 tuple)以及某些非序列类型例如 dict、文件对象 以及定义了
__iter__()
方法或是实现了 Sequence 语义的__getitem__()
方法的任意自定义类对象。
可迭代对象被可用于 for 循环以及许多其他需要一个序列的地方(zip()、map() ...)。当一个可迭代对象作为参数传给内置函数
iter()
时,它会返回该对象的迭代器。这种迭代器适用于对值集合的一次性遍历。在使用可迭代对象时,你通常不需要调用iter()
或者自己处理迭代器对象。for 语句会为你自动处理那些操作,创建一个临时的未命名变量用来在循环期间保存迭代器。
iterator -- 迭代器
用来表示一连串数据流的对象。重复调用迭代器的
__next__()
方法(或将其传给内置函数next()
)将逐个返回流中的项。当没有数据可用时则将引发StopIteration
异常。到这时迭代器对象中的数据项已耗尽,继续调用其__next__()
方法只会再次引发StopIteration
异常。迭代器必须具有__iter__()
方法用来返回该迭代器对象自身,因此迭代器必定也是可迭代对象,可被用于其他可迭代对象适用的大部分场合。一个显著的例外是那些会多次重复访问迭代项的代码。容器对象(例如 list)在你每次向其传入iter()
函数或是在 for 循环中使用它时都会产生一个新的迭代器。如果在此情况下你尝试用迭代器则会返回在之前迭代过程中被耗尽的同一迭代器对象,使其看起来就像是一个空容器。
generator -- 生成器
返回一个 generator iterator 的函数。它看起来很像普通函数,不同点在于其包含 yield 表达式以便产生一系列值供给 for-循环使用或是通过
next()
函数逐一获取。
生成和遍历
Python 使用函数iter()
生成迭代器,使用next()
或for循环逐一访问成员项。
iter函数
-iter(iterable) -> iterator
: 使用可迭代对象生成迭代器,字符串、列表、字典等都是可迭代对象。
-
iter(callable, sentinel) -> iterator
:使用可调用对象生成迭代器,sentinel是迭代的结束标志。
# 使用可调用对象生成迭代器
class MyNum:
i = 0
def get_value(self):
self.i += 1
return self.i - 1
n = MyNum()
it = iter(n.get_value, 4)
print(next(it)) # 输出0
print(next(it)) # 输出1
# 使用可迭代对象生成迭代器
it = iter([1, 2, 3, 4])
for x in it:
print(x)
自定义迭代器
class Rabbits:
def __iter__(self):
return FibSeq()
class FibSeq:
def __init__(self):
self.a = 0
self.b = 1
def __iter__(self):
return self
def __next__(self):
self.a, self.b = self.b, self.a + self.b
if self.b > 1000000:
raise StopIteration
return self.a
it = FibSeq()
print(next(it))
print(next(it))
print(next(it))
it2 = iter(Rabbits())
for x in it2:
print(x)
if x > 10:
break
说明:
- Rabbits类定义了
__iter__
方法,是一个可迭代对象。 - FibSeq定义了
__next__
,是一个迭代器,同时也是一个可迭代对象。 - 可迭代Rabbits的
__iter__
返回一个FibSeq对象, 迭代器FibSeq的__iter__
方法返回其自身。 -
__next__
应在迭代结束时触发StopIteration异常
使用生成器
生成器是一个包含yield
表达式的函数。
把一个嵌套的数组扁平化,假设嵌套数组只有2层:
def flatten(nested):
for sublist in nested:
for element in sublist:
yield element
nested = [[1, 2], [3, 4], [5]]
l = list(flatten(nested))
print(l)
# 输出: [1, 2, 3, 4, 5]
如果nested不止两层,或者层数参差不齐,成树形结构,上面的扁平化函数就显得力不从心,这时可以借助栈或队列实现;一种巧妙的方式是使用递归实现:
def flatten(nested):
try:
for sublist in nested:
for element in flatten(sublist):
yield element
except TypeError:
yield nested
nested = [[1, 2], [3, 4], [5,[6, 7]]]
l = list(flatten(nested))
print(l)
# 输出: [1, 2, 3, 4, 5, 6, 7]