增量式分析xml文件,以便尽量少的占用内存。
在python中增量式的处理数据时,首先想到的是迭代器和生成器;
常用的使用xml.etree.ElementTree
??榻衳ml文件分析:
from xml.etree.ElementTree import parse
from collections import Counter
potholes_by_zip=Counter()
doc=parse('potholes.xml')
for pothole in doc.iterfind('row/row'):
potholes_by_zip[pothole.findtext('zip')]+=1
for zipcode,num in potholes_by_zip.most_common():
print(zipcode,num)