python各种模块,迭代器,生成器

阅读量：6759 次

发布时间：2019-06-26

本文共 25664 字，大约阅读时间需要 85 分钟。

从逻辑上组织python代码（变量，函数，类，逻辑：实现一个功能）

本质就是.py结尾的python文件(文件名：test.py,对应的模块名就是test)

包：用来从逻辑上组织模块的,本质就是一个目录（必须带有一个叫__init__.py文件），（package:包，派kez着）

模块的分类

a.标准库（sys，os）, lib 目录下（home 目录/pythonXX.XX/lib）

b.开源模块，第三方库, 在 lib 下的 site-packages 目录下

c.自定义模块

标准库：time时间戳:timestamp(相对于1970.1.1 00:00:00至当前以秒计算,时间戳是惟一的)：time.time()时间戳,time.sleep(),格式化时间字符串：time.strftime('%Y-%m-%d %H:%M:%S')死追福，time.strptime('1974-01-14 04:53:19','%Y-%m-%d %H:%M:%S')元祖（struct_time）共九个元素：time.gmtime()把时间戳转换为UTC标准时间，time.localtime()把时间戳转换到本地时间UTC+8time.mktime()把元祖形式装换为时间戳python的time模块主要调用C库，所以各平台有所不同UTC：世界标准时间，中国为UTC+8（比标准时间早8小时）,  DST：夏令时print(time.gmtime(time.time()-86400))#将时间戳转化为struct_time,为UTC时间,与中国时间差8小时print(time.strftime('%Y-%m-%d %H:%M:%S',time.gmtime()))#差8小时时间2018-05-26 14:20:54print(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime()))#本地时间x=time.localtime(1111999999)print(x)print(x.tm_year)print('this is 2005 day :%d' %x.tm_yday)x=time.localtime(1111999999)print(time.mktime(x))x=time.localtime(1111999)print(time.strftime('%Y-%m-%d %H:%M:%S',x))#返回本地时间,转化为字符串格式,展示:1970-01-14 04:53:19print(time.strptime('1974-01-14 04:53:19','%Y-%m-%d %H:%M:%S'))#字符串转为时间对象,展示: time.struct_time(tm_year=1974, tm_mon=1, tm_mday=14, tm_hour=4, tm_min=53, tm_sec=19, tm_wday=0, tm_yday=14, tm_isdst=-1)print(time.asctime())#把元祖转换为格式化字符串print(time.ctime())#把时间戳转换为格式化字符串,当前时间print(time.ctime(time.time()-86400))#昨天时间help(time)#帮助help(time.gmtime())#帮助Import datetimeprint(datetime.date)#表示日期的类。常用的属性有year, month, day；print(datetime.time)#表示时间的类。常用的属性有hour, minute, second, microsecond；print(datetime.datetime.now())#当前日期时间print(datetime.date.fromtimestamp(time.time() - 86400))#时间戳转化为日期格式print(datetime.datetime.now()+datetime.timedelta(3))#当前时间+3天print(datetime.datetime.now()+datetime.timedelta(-3)) #当前时间-3天print(datetime.datetime.now()+datetime.timedelta(hours=-3))#当前时间+3小时print(datetime.datetime.now()+datetime.timedelta(minutes=30))#当前时间+30分print(datetime.datetime.now() + datetime.timedelta(weeks=1))#一周后current_time = datetime.datetime.now()print(current_time.replace(2018,5,2))#如指定日期就会替换当前日期,未指定输出当前日期c_time  = datetime.datetime.now()print(c_time.replace(minute=3,hour=2)) #时间替换格式参照%a    本地（locale）简化星期名称    %A    本地完整星期名称    %b    本地简化月份名称    %B    本地完整月份名称    %c    本地相应的日期和时间表示    %d    一个月中的第几天（01 - 31）    %H    一天中的第几个小时（24小时制，00 - 23）    %I    第几个小时（12小时制，01 - 12）    %j    一年中的第几天（001 - 366）    %m    月份（01 - 12）    %M    分钟数（00 - 59）    %p    本地am或者pm的相应符    一    %S    秒（01 - 61）    二    %U    一年中的星期数。（00 - 53星期天是一个星期的开始。）第一个星期天之前的所有天数都放在第0周。    %w    一个星期中的第几天（0 - 6，0是星期天）  %W    和%U基本相同，不同的是%W以星期一为一个星期的开始。    %x    本地相应日期    %X    本地相应时间    %y    去掉世纪的年份（00 - 99）    %Y    完整的年份    %Z    时区的名字（如果不存在为空字符）    %%      ‘%’字符

时间关系转换

import random#（随机 软的木）print (random.random())#生成一个0到1的随机符点数print (random.randint(1,7)) #生成指定范围内的整数。print (random.randrange(10,100,2)) #函数原型为：random.randrange([start], stop[, step])# 从指定范围内，按指定基数递增的集合中 获取一个随机数# random.randrange(10, 100, 2)在结果上与 random.choice(range(10, 100, 2) 等效。print(random.choice('liukun')) #从序列中获取一个随机元素(选择，超爱思)# 其函数原型为：random.choice(sequence)。参数sequence表示一个有序类型,不是一种特定的类型，而是泛指一系列的类型# 下面是使用choice的一些例子：list, tuple, 字符串,都属于sequence（顺序，C库润死）print(random.choice("学习Python"))print(random.choice(["JGood","is","a","handsome","boy"]))print(random.choice(("Tuple","List","Dict")))print(random.sample([1,2,3,4,5,9],2))#（样品，散婆）#函数原型为：random.sample(sequence, k)，从指定序列中随机获取指定长度的片断,sample函数不会修改原有序列。实际应用：# 随机整数：print(random.randint(0, 99))# 随机选取0到100间的偶数：print(random.randrange(0, 101, 2))# 随机浮点数：print(random.random())print(random.uniform(1, 10))#（ 规格一致的，优尼佛）# 随机字符：print(random.choice('abcdefg&#%^*f'))# 多个字符中选取特定数量的字符：print(random.sample('abcdefghij', 3))# 随机选取字符串：print(random.choice(['apple', 'pear', 'peach', 'orange', 'lemon']))# 洗牌#items = [1, 2, 3, 4, 5, 6, 7]print(items)random.shuffle(items)（#洗牌，稍佛）print(items)随机生成验证码import randomcheckcode=''#先定一个空的全局变量for i in range(4):    current=random.randrange(0,4)#现在的，卡润特    if current==i:        tmp=chr(random.randint(65,90))    else:        tmp=random.randint(0,9)    checkcode+=str(tmp)print(checkcode)def ac(year):#判断一个年份是否为闰年    if year%4==0 and year%100!=0:        print('{}是瑞年'.format(year))    elif year%400==0:        print('{}是瑞年'.format(year))    else:         print('{}不是瑞年'.format(year))ac(2020)

OS模块import os#os模块系统级别的操作print(os.getcwd())#类似Linux：pwd获取当前工作目录，即当前python脚本工作的目录路径print(os.chdir(r"C:\Users"))#类似Linux：cd改变当前脚本工作目录,print(os.chdir("C:\\Users\LLT\Desktop\python\第五周\module_test"))#同上print(os.curdir)#  返回当前目录: ('.')print(os.pardir)# 获取当前目录的父目录字符串名：('..')print(os.makedirs(r"D:\Users\a\b\c"))#可生成多层递归目录print(os.removedirs(r"D:\Users\a\b\c"))# 若目录为空，则删除，并递归到上一级目录，如若也为空，则删除，依此类推print(os.mkdir(r'D:a'))#生成单级目录；相当于shell中mkdirprint(os.rmdir(r'D:a'))#删除单级空目录，若目录不为空则无法删除，报错；相当于shell中rmdirprint(os.listdir('..'))# 列出指定目录下的所有文件和子目录，包括隐藏文件，并以列表方式打印print(os.remove())# 删除一个文件print(os.rename("oldname","newname"))#重命名文件/目录print(os.stat(r'D:a'))#获取文件/目录信息,加.st_size可以获取大小print(os.sep)#重要 输出操作系统特定的路径分隔符，win下为"\\",Linux下为"/"print(os.linesep)#重要 win下为"\r\n",Linux下为"\n"print(os.pathsep)#重要 输出用于分割文件路径的字符串，win下为";",Linux下为":"print(os.name)#输出字符串指示当前使用平台,win->'nt'; Linux->'posix'print(os.system("ipconfig /all"))#运行shell命令，直接显示print(os.environ)# 获取系统环境变量，（因哇妖门，包围）print(os.path.abspath('Path'))#返回path规范化的绝对路径print(os.path.split('D:\LAMP.docx'))#将path分割成目录和文件名二元组返回（死不列特，分裂）print(os.path.dirname('D:\LAMP.docx'))#返回path的目录。其实就是os.path.split(path)的第一个元素print(os.path.basename('D:\LAMP.docx'))#返回path最后的文件名,如果path以／或\结尾，那么就会返回空值，即os.path.split(path)的第二个元素（就是文件名）print(os.path.exists('path'))#如果path存在，返回True；如果path不存在，返回False（a可晒死，存在）print(os.path.isabs('path'))#如果path是绝对路径，返回True,否则返回False,win->r'c:\a绝对'，r'a相对'; Linux->r'/a/b绝对'win有多个根目录，Linux只有一个/为根目录print(os.path.isfile('path'))#如果path是一个存在的文件，返回True,否则返回False（is费儿，是文件）print(os.path.isdir('path'))#如果path是一个存在的目录，则返回True。否则返回Falseprint(os.path.join(r'c:',r'\a',r'\b'))#将多个路径组合后返回，第一个绝对路径之前的参数将被忽略,输出：c:\bprint(os.path.getatime('D:\\a'))#返回path所指向的文件或者目录的最后存取时间print(os.path.getmtime('D:\\a'))#返回path所指向的文件或者目录的最后修改时间

创建目录函数:

import os# 引入模块def mkdir(path):    path = path.strip()# 去除首位空格    path = path.rstrip("\\")# 去除尾部 \ 符号    isExists = os.path.exists(path)#判断一个目录是否存在,存在True,不存在False    if not isExists:# 判断结果        os.makedirs(path)# 创建目录操作函数,无父目录会自动创建父目录,创建多层目录        #os.mkdir(path)#创建目录操作函数,无父目录会提示路径不存在,创建目录        print (path + ' 创建成功')# 如果不存在则创建目录        return True    else:        print( path + ' 目录已存在')# 如果目录存在则不创建，并提示目录已存在        return Falsemkpath = "E:\\test\\web2\\"# 定义要创建的目录mkdir(mkpath)# 调用函数

Sys模块

import sys#解释器相关的模块print(sys.argv)#命令行参数List，第一个元素是程序本身路径print(sys.exit())#退出程序，正常退出时exit(0),exit(‘goodbye’)可以传值print(sys.version)#获取Python解释程序的版本信息print(sys.maxint)#最大的Int值,py2.7print(sys.path)#返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值print(sys.platform)#返回操作系统平台名称sys.stdout.write('please:') #sys模块下的标准输出sys.stdin.readline()#文本输入

hashlib模块　　

用于加密相关的操作，3.x里代替了md5模块和sha模块，主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ，MD5 算法哈希算法存，取之所以快,是因为其直接通过关键字key得到要存取的记录内存存储地址，从而直接对该地址进行读或写。MD5import hashlibm = hashlib.md5()#哈希礼毕m.update(b"Hello")#b ：bytes 类型print(m.hexdigest())#加密后16进制格式hash， #2进制格式hashm.update("It's me你好".encode(encoding=‘utf-8’))#加汉字需加encodeprint(m.hexdigest())#打印Hello加It's me的16进制，如下M2例子m.update(b"It's been a long time")print(m.hexdigest())#打印Hello加It's me加It's been a long time的16进制，如下M3例子m = hashlib.md5(bytes('dsad232',encoding='utf-8'))m.update(bytes("Hello",encoding='utf-8'))print(m.hexdigest())#使用这种方法(dsad232)对Hello二次加密(加严),推荐使用这种方法m2 = hashlib.md5()m2.update(b"HelloIt's me")print(m2.hexdigest())m3 = hashlib.md5()m3.update(b"HelloIt's meIt's been a long time")print(m3.hexdigest())Sha1s2=hashlib.sha1()#SSL证书的sha1已被淘汰,通用sha256()s2.update(b"HelloIt's me")print(s2.hexdigest())Sha256hash = hashlib.sha256()hash.update(b"HelloIt's me")print(hash.hexdigest())Sha384hash = hashlib.sha384()hash.update(b"HelloIt's me")print(hash.hexdigest())Sha512hash = hashlib.sha512()hash.update(b"HelloIt's me")print(hash.hexdigest())

MD5实现加密登录注册 import hashlibdef md5(args):    ooo = hashlib.md5(bytes('dsfdsfsds',encoding='utf-8'))    ooo.update(bytes(args,encoding='utf-8'))    return ooo.hexdigest()def login(user,pwd):    with open('db','r',encoding='utf-8') as f:        for line in f:            u,p = line.strip().split('|')            if u == user and p == md5(pwd):                return Truedef register(user,pwd):    with open('db','a',encoding='utf-8') as f:        temp = user + '|' + md5(pwd)        f.write(temp)i = input('1,登录: 2,注册:')if i == '2':    user = input('用户名:')    pwd = input('密码:')    register(user,pwd)elif i == '1':    user = input('用户名:')    pwd = input('密码')    r = login(user,pwd)    if r:        print('登录成功')    else:        print('登录失败 ')

shutil模块

高级的 文件、文件夹、压缩包 处理模块import shutilf1=open('本节笔记',encoding='utf-8')f2=open('笔记2','w',encoding='utf-8')import shutilshutil.copyfileobj(open('xo.xml', 'r'), open('new.xml', 'w'))# 将文件内容拷贝到另一个文件中shutil.copyfileobj(f1,f2)#将文件内容拷贝到另一个文件中，可以部分内容shutil.copyfile('笔记2','笔记3')#拷贝文件，笔记2拷贝到笔记3shutil.copymode('笔记2','笔记3')#仅拷贝权限,内容、组、用户均不变shutil.copystat('本节笔记','笔记3')#拷贝状态的信息，包括：mode bits, （atime访问时间）, （mtime其时）, （flags标示）shutil.copy('笔记2','笔记3')#拷贝文件和权限shutil.copy2('笔记2','笔记3')#拷贝文件和状态信息shutil.copytree('test4','new_test4')#递归的去拷贝文件shutil.rmtree('new_test4')#递归的去删除文件shutil.move()#递归的去移动文件shutil.make_archive('shutil_archive_test','zip','path路径')#创建压缩包并返回文件路径，例如：zip、tarimport zipfile#shutil 对压缩包的处理是调用 ZipFile 和 TarFile 两个模块来进行的z=zipfile.ZipFile('day5.zip','w')#压缩z.write('p_test.py')print('-------')z.write('笔记2')z.close()z = zipfile.ZipFile('day5.zip', 'r')# 解压z.extractall()z.close()

shelve模块

import shelve #shelve模块是一个简单的k,v将内存数据通过文件持久化的模块，可以持久化任何pickle可支持的python数据格式import datetimed = shelve.open('shelve_test')  # 打开一个文件info={
    'age':22,'job':'it'}name = ["alex", "rain", "test"]d["name"] = name  # 持久化列表d["info"] = info  # 持久化字典d["date"] =datetime.datetime.now()d.close()print(d.get('name'))#生成之后重新读取print(d.get('info'))#生成之后重新读取print(d.get('date'))#生成之后重新读取

模块追加:

'''我是注释'''print(__doc__)#打印py文件的注释print(__file__)#打印本身自己的路径from 第一天.abc import bcdprint(bcd.__package__)#py文件所在的文件夹,当前文件为none,导入其它文件用.划分,输出:第一天.abcprint(bcd.__cached__)#缓冲print(__name__)#执行文件会输出__main__,用在调用程序的入口,print(bcd.__name__)#输出文件夹一级一级的路劲#   执行文件时 __name__ == '__main__'执行程序,否则执行模块#如果导入bcd模块的话name就不等于main就不执行下面的主文件调用主函数时,必须增加判断,执行主函数if __name__ == '__main__':    bcd.foo()import osimport sys#__file__获取绝对路径,使用os.path.join/os.path.dirname拼接两个路径p1 = os.path.dirname(__file__)p2 = 'lib'mk_dir = os.path.join(p1,p2)sys.path.append(mk_dir)__loader__#解释器加载,系统使用__builtins__#放置所有内置函数

json与pickle模块数据序列化

json是所有语言都通用的，支持不同语言之间数据交互（如list、tuple、dict和string），只能处理简单的因为是跨语言的。eval()函数将字符串转成相应的对象（如list、tuple、dict和string之间的转换）       也可利用反引号转换的字符串再反转回对象>>> a = "[[1,2], [3,4], [5,6], [7,8], [9,0]]">>> b = eval(a)>>> b[[1, 2], [3, 4], [5, 6], [7, 8], [9, 0]]在程序的运行过程中，所有的变量都是在内存中，变量在内存中来得快也去得快，需要将内存中的变量转化为可存储的对象或者可传输的对象，这样的过程就叫做序列化。 Python中提供了pickle模块来实现对象的序列化与反序列化，pickle.dumps()将任意的对象序列化成一个bytes。pickle.loads()实现反序列化，得到对象。Json序列化import jsoninfo={    'name':'zc',    'age':29,}f=open('test.txt','w')f.write(json.dumps(info))#【废物，当木浦斯】,将python基本数据类型装换为字符串f.close()s = ['zc','zc1','zc2']s1 = json.dumps(s)print(s1,type(s))#输出:["zc", "zc1", "zc2"] 
     
      Json反序列化import jsonf=open('test.txt','r')data=json.loads(f.read())#【狼子，负载】,用于将字典,列表,元祖形式的字符串转换成相应的字典列表元祖print(data['age'])s = '{"desc":"nihao","avg":20}'#注意单双引号re = json.loads(s)print(re,type(re))Python内置的json模块提供了完备的Python对象到JSON格式的转换。将Python对象变为一个JSON："""利用json模块序列化与反序列化"""import jsondi = dict(name='BOb', age=20, score=93)>>> json.dumps(di)'{"name": "BOb", "age": 20, "score": 93}'同理，将JSON反序列化为Python对象：json_str = '{"name": "BOb", "age": 20, "score": 93}'>>> json.loads(json_str){
     'score': 93, 'name': 'BOb', 'age': 20}Pickle序列化（只可以在python中使用）它可以序列化任何对象并保存到磁盘中，并在需要的时候读取出来， 功能比json强大import pickledef sayhi(name):    print('hello',name)info={    'name':'zc',    'age':29,    'func':sayhi}f=open('test.txt','wb')f.write(pickle.dumps(info))#【腌菜，陪考 】 完全等于 pickle.dump(info,f)f.close()Pickle反序列化import pickledef sayhi(name):    print('hello',name)f=open('test.txt','rb')data=pickle.loads(f.read())#【狼子，负载】  完全等于 data=pickle.load(f) print(data['func']('zc'))

Pickle模块最常用函数：

（1）pickle.dump(obj, file, [,protocol])

函数的功能：将obj对象序列化存入已经打开的file中。

· obj：想要序列化的obj对象。

· file:文件名称。

· protocol：序列化使用的协议。如果该项省略，则默认为0。如果为负值或HIGHEST_PROTOCOL，则使用最高的协议版本。

（2）pickle.load(file)

函数的功能：将file中的对象序列化读出。

参数讲解：

· file：文件名称。

（3）pickle.dumps(obj[, protocol])

函数的功能：将obj对象序列化为string形式，而不是存入文件中。

· obj：想要序列化的obj对象。

· protocal：如果该项省略，则默认为0。如果为负值或HIGHEST_PROTOCOL，则使用最高的协议版本。

（4）pickle.loads(string)

函数的功能：从string中读出序列化前的obj对象。

· string：文件名称。

【注】 dump() 与 load() 相比 dumps() 和 loads() 还有另一种能力：dump()函数能一个接着一个地将几个对象序列化存储到同一个文件中，2.5里面调用load()来以同样的顺序反序列化读出这些对象。3.0里面只能load()一次。写程序最好dump()一次load()一次。

第三方模块安装:

# 第三方模块按装方法:

# 1.软件管理工具 pip3,安装pip3依赖于setuptools,需先安装它,py3自带有pip3,将增加环境变量E:\Python36\Scripts,
# pip3 install requests
# 2.源码安装下载源码安装
#下载源码>解压>进入win终端目录>执行python setup.py install

Requests

import requests#发送http请求,获取请求返回值(用py模拟浏览器浏览网页)response = requests.get('https://www.hao123.com/')response.encoding = 'utf-8'result = response.text #返回内容print(result)

判断qq是否在线:import requests #使用第三方模块requests发送http请求,或者XML格式内容(局部xml内容)"""该程序依赖于QQ的端口程序返回数据：String，Y = 在线；N = 离线；E = QQ号码错误；A = 商业用户验证失败；V = 免费用户超过数量"""url0 = 'http://www.webxml.com.cn/webservices/qqOnlineWebService.asmx/qqCheckOnline?qqCode='url1 = input('请输入QQ号码:')url = url0 + str(url1)r = requests.get(url)result = r.text #字符串类型print(result)from xml.etree import ElementTree as ET# 解析XML格式内容# XML接收一个参数,字符串, 格式化为特殊的对象node = ET.XML(result)#获取内容if node.text == 'Y':    print('在线')elif node.text == 'N':    print('离线')elif node.text == 'E':    print('QQ号码错误')elif node.text == 'A':    print('商业用户验证失败')else:    print('免费用户超过数量')

获取列车时刻表:import urllibimport requestsfrom xml.etree import ElementTree as ET# 使用内置模块urllib发送HTTP请求，或者XML格式内容(局部xml内容)# f = urllib.request.urlopen('http://www.webxml.com.cn/WebServices/TrainTimeWebService.asmx/getDetailInfoByTrainCode?TrainCode=G666&UserID=')# result = f.read().decode('utf-8')# 使用第三方模块requests发送HTTP请求，或者XML格式内容(局部xml内容)r = requests.get('http://www.webxml.com.cn/WebServices/TrainTimeWebService.asmx/getDetailInfoByTrainCode?TrainCode=k448&UserID=')result = r.text# 解析XML格式内容root = ET.XML(result)for node in root.iter('TrainDetailInfo'):#iter迭代循环所有内容中的TrainDetailInfo    # print(node.tag, )#获取头部    # print(node.attrib)#获得整个属性    print(node.find('TrainStation').text,node.find('StartTime').text)

Xml模块

xml是实现不同语言或程序之间进行数据交换的协议，跟json差不多，但json使用起来更简单，在json还没出现时，只能选择用xml，至今很多传统公司如金融行业的很多系统的接口还主要是xml。xml的格式代码如下，就是通过<>节点来区别数据结构的
         
              
       
        2
               
       
        2008
               
       
        141100
               
               
           
      import xml.etree.ElementTree as ETtree=ET.parse('Xml模块.xml')root=tree.getroot()print(root.tag)#打印开头标签内存地址for child in root:#遍历xml文档    print(child.tag,child.attrib)#打印开头标签属性    for i in child:        print(i.tag,i.text)for node in root.iter('year'):#只遍历year节点     print(node.tag,node.text)import xml.etree.ElementTree as ETtree = ET.parse("xml模块.xml")root = tree.getroot()修改for node in root.iter('year'):    new_year = int(node.text) + 1    node.text = str(new_year)    node.set("updated_by", "zc")#修改的是内存数据,需要重新创建文件写入tree.write("xml模块.xml")删除for country in root.findall('country'):#root.findall可以找出所有country    rank = int(country.find('rank').text)#判断country下的rank    if rank > 50:#        root.remove(country)tree.write('output.xml')创建import xml.etree.ElementTree as ETnew_xml = ET.Element("namelist")#根节点personinfo = ET.SubElement(new_xml, "personinfo", attrib={
    "enrolled": "yes"})#personinfo为new_xml子节点，节点名：name,属性：attribname = ET.SubElement(personinfo,'name')name.text='zc'age = ET.SubElement(personinfo, "age", attrib={
    "checked": "no"})#age为personinfo的子节点，其它同上sex = ET.SubElement(personinfo, "sex")#同上age.text = '33'#age赋值personinfo2 = ET.SubElement(new_xml, "personinfo2", attrib={
    "enrolled": "no"})name = ET.SubElement(personinfo2,'name')name.text='zc1'age = ET.SubElement(personinfo2, "age")age.text = '19'et = ET.ElementTree(new_xml)  # 生成文档对象et.write("test.xml", encoding="utf-8", xml_declaration=True)#xml_declaration声明为xml格式ET.dump(new_xml)  # 打印生成的格式from xml.etree import ElementTree as ET############ 解析方式一 ############str_xml = open('xo.xml', 'r').read()# 打开文件，读取XML内容root = ET.XML(str_xml)# 将字符串解析成xml特殊对象，root代指xml文件的根节点############ 解析方式二 ############# 直接解析xml文件tree = ET.parse("xo.xml")# 获取xml文件的根节点root = tree.getroot()### 操作print(root.tag)# 顶层标签for node in root.iter('year'):# 遍历XML中所有的year节点    print(node.tag, node.text)# 节点的标签名称和内容from  xml.etree import ElementTree as ET#etree文件夹tree = ET.parse('xo.xml')#直接解析xml文件# ####### 一切皆对象 ##########对象都由类创建,对象的所有功能都在与其相关的类中#tree#1.ElementTree类创建#2.getroot()获取xml跟节点#3.write()内存中的xml写入文件中root = tree.getroot()#或许xml文件根节点,Element类型#Element类创建的对象#print(root.tag)#print(root.attrib)#print(root.text)#   ##########方式1############ son = root.makeelement('tt',{'kk':'vv'})#创建节点Element类型# s = son.makeelement('tt',{'kk':'123'})#   ##########方式2###########son = ET.Element('tt',{
    'kk':'十一'})ele2 = ET.Element('tt',{
    'kk':'1234'})#里面的数字必须带引号#   ##########方式3(可以直接保存写入)###########'''ET.SubElement(root,'family',{'age':'19'})son = ET.SubElement(root,'family',{'age':'11'})ET.SubElement(son,'family',{'age':'十一'})'''son.append(ele2)root.append(son)tree.write('out.xml',encoding='utf-8',xml_declaration=True)#使用tree.write保存写入,编码格式,申明常用的几种属性:# tag   # attrib      # find    # iter    # set        # get        #text带缩进的xml格式:from xml.etree import ElementTree as ETfrom xml.dom import minidom#带缩进的xmldef prettify(elem):    """将节点转换成字符串，并添加缩进。    """    rough_string = ET.tostring(elem, 'utf-8')    reparsed = minidom.parseString(rough_string)    return reparsed.toprettyxml(indent="\t")root = ET.Element("famliy")# 创建根节点# 创建大儿子# son1 = ET.Element('son', {'name': '儿1'})son1 = root.makeelement('son', {
    'name': '儿1'})# 创建小儿子# son2 = ET.Element('son', {"name": '儿2'})son2 = root.makeelement('son', {
    "name": '儿2'})# 在大儿子中创建两个孙子# grandson1 = ET.Element('grandson', {'name': '儿11'})grandson1 = son1.makeelement('grandson', {
    'name': '儿11'})# grandson2 = ET.Element('grandson', {'name': '儿12'})grandson2 = son1.makeelement('grandson', {
    'name': '儿12'})son1.append(grandson1)son1.append(grandson2)# 把儿子添加到根节点中root.append(son1)root.append(son1)raw_str = prettify(root)f = open("xxxoo.xml",'w',encoding='utf-8')f.write(raw_str)f.close()

ymal模块

Python也可以很容易的处理ymal文档格式，只不过需要安装一个模块（python 。。。 install），然后导入from yaml import load, dump  #压麦尔

主要用来做配置文件的

Configparser模块

用于生成和修改常见配置文档

写入import configparser#py2里面ConfigParserconfig = configparser.ConfigParser()#调configparser对象进来config["DEFAULT"] = {
    'ServerAliveInterval': '45',#第一个节点                     'Compression': 'yes',                     'CompressionLevel': '9'}config['bitbucket.org'] = {}#第二个节点config['bitbucket.org']['User'] = 'hg'config['topsecret.server.com'] = {}#第三个节点config['topsecret.server.com']config['topsecret.server.com']['Host Port'] = '50022'config['topsecret.server.com']['ForwardX11'] = 'no'config['DEFAULT']['ForwardX11'] = 'yes'#第一个节点增加with open('example.ini', 'w') as configfile:#写入    config.write(configfile)读取import configparserconf=configparser.ConfigParser()conf.read('example.ini')print(conf.defaults())print(conf.sections())print(conf['bitbucket.org']['User'])for key in conf['bitbucket.org']:#循环读出来    print(key)删sec = conf.remove_section('bitbucket.org')conf.write(open('example.cfg', "w"))增sec = conf.add_section('zc1')#增加conf.write(open('example.cfg', "w"))获取所有节点:import configparserconfig = configparser.ConfigParser()config.read('xxxooo', encoding='utf-8')ret = config.sections()print(ret)获取指定节点下所有键值对:config = configparser.ConfigParser()config.read('xxxooo', encoding='utf-8')ret = config.items('section1')print(ret)获取指定节点下所有的键:config = configparser.ConfigParser()config.read('xxxooo', encoding='utf-8')ret = config.options('section1')print(ret)获取指定节点下指定key值config = configparser.ConfigParser()config.read('xxxooo', encoding='utf-8')v = config.get('section1', 'k1')print(v)检查节点是否存在config = configparser.ConfigParser()config.read('xxxooo', encoding='utf-8')has_sec = config.has_section('section1')print(has_sec)#返回True

hmac模块

散列消息鉴别码，简称HMAC，是一种基于消息鉴别码MAC（Message Authentication Code）的鉴别机制。使用HMAC时,消息通讯的双方，通过验证消息中加入的鉴别密钥K来鉴别消息的真伪；一般用于网络通信中消息加密，前提是双方先要约定好key,就像接头暗号一样，然后消息发送把用key把消息加密，接收方用key ＋消息明文再加密，哪加密后的值跟发送者的相对比是否相等，这样就能验证消息的真实性，及发送者的合法性了。

import hmacs2 =hmac.new(b"124","我放假".encode(encoding="utf-8"))#可以运行 并顺利加密，：哈希麦克s2 =hmac.new(b"jkhj","我放假".encode(encoding="utf-8"))#可以运行并顺利加密s2 =hmac.new("网址之王".encode(encoding="utf-8"))#可以运行 并且顺利加密s2 =hmac.new("网址之王","我放假".encode(encoding="utf-8")) #不可以运行  出错print(s2.hexdigest())#py3.6为演示成功

subprocess模块

import subprocess#用于python执行系统命令ret = subprocess.call('ipconfig')#执行命令返回状态码ret = subprocess.check_output('ipconfig')#执行命令如果是0返回执行结果,否则抛异常print(ret)

logging模块

import logginglogging.basicConfig(filename='log.log',                    format='%(asctime)s - %(name)s - %(levelname)s -%(module)s:  %(message)s',                    datefmt='%Y-%m-%d %H:%M:%S %p',                    level=logging.INFO,)'''CRITICAL = 50FATAL = CRITICALERROR = 40WARNING = 30WARN = WARNINGINFO = 20DEBUG = 10NOTSET = 0'''logging.debug('debug')logging.info('info')logging.warning('warning')logging.error('error')logging.critical('critical')logging.log(logging.INFO,'log')注：只有【当前写等级】大于【日志等级】时，日志文件才被记录。日志记录在多个文件中:定义文件import loggingfile_1_1 = logging.FileHandler('l1_1.log', 'a', encoding='utf-8')fmt = logging.Formatter(fmt="%(asctime)s - %(name)s - %(levelname)s -%(module)s:  %(message)s")file_1_1.setFormatter(fmt)file_1_2 = logging.FileHandler('l1_2.log', 'a', encoding='utf-8')fmt = logging.Formatter()file_1_2.setFormatter(fmt)# 定义日志logger1 = logging.Logger('s1', level=logging.ERROR)logger1.addHandler(file_1_1)logger1.addHandler(file_1_2)# 写日志logger1.critical('1111')

迭代器与生成器

Generator 生成器，摘呢瑞特生成器：1.只有在调用的时候才会生成相应的数据，调用哪次就生成哪次，2.只记录当前位置，3.只有一个_next_()调用下一次方法，py2是next()方法列表生成式使代码更简洁m=[i*2 for i in range(10)]print (m)a=[]#这个要三行for i in range(10):    a.append(i*2)print (a)b=(i*2 for i in range(10))for i in b:    print(i)

生成器

生成器函数（函数内部有yield关键字）yield语句一次返回一个结果，在每个结果中间，挂起函数的状态，以便下次从它离开的地方继续执行生成器小结：　　　　1.是可迭代对象　　　　2.实现了延迟计算,省内存　　　　3.生成器本质和其他的数据类型一样，都是实现了迭代器协议，只不过生成器附加了一个延迟计算省内存的好处，其余的可迭代对象可没有这点好处！通过函数做的一个生成器def fib(max):    n,a,b=0,0,1    while n
     
      n:            return        yield start        start += 1obj = range(5)n1 = obj.__next__()#生成器的__next__方法,执行函数寻找下一个yieldn2 = obj.__next__()#obj叫做生成器,具有生成能力n3 = obj.__next__()n4 = obj.__next__()n5 = obj.__next__()n6 = obj.__next__()print(n1,n2,n3,n4,n5,n6)单线程下的并行（也叫协程）线程包含于进程，协程包含于线程。只要内存足够，一个线程中可以有任意多个协程，但某一时刻只能有一个协程在运行，多个协程分享该线程分配到的计算机资源。import timedef consumer(name):#肯赛末，消费者    print('%s 准备吃包子'%name)    while True:        baozi=yield        print('包子[%s]来了，被[%s]吃了'%(baozi,name))c=consumer('zhangchao')c.__next__()b1='肉包子'c.send(b1)#发送，森的，唤醒生成器并传值给它c.__next__()def producer(name):#普丢色，生产者    c=consumer('A')    c2=consumer('B')    c.__next__()    c2.__next__()    print('生产包子')    for i in range(10):        time.sleep(1)        print('做了2个包子')        c.send(i)        c2.send(i)producer('zc')迭代器1.迭代需要重复进行某一操作，2.本次迭代的要依赖上一次的结果继续往下做，如果中途有任何停顿，都不能算是迭代.迭代器优点:　　　　1.节约内存，2.不依赖索引取值，3.实现惰性计算(什么时候需要，在取值出来计算)# 非迭代，仅仅只是在重复一件事结果并不依赖上一次出的值count = 0while count < 10:    print("hello world")    count += 1# 迭代，重复+继续count = 0while count < 10:    print(count)    count += 1

# from collections import  Iterable #收集，可来可神死。可迭代的，易特瑞宝，# isinstance()#判断一个对象是否是Iterable对象# isinstance([],Iterable)# isinstance({},Iterable)# isinstance('ABC',Iterable)# isinstance(100,Iterable)#整数不是可迭代对象     #可以直接作用于for循环的数据类型# 1.集合数据类型：list,tuple，dict,set，str等# 2.generator,包括生成器和带yield的generator function# 可作用于for循环的对象统称为可迭代对象#生成器可以作用于for循环，还可以被_next_()函数不断调用并返回下一个值，直到抛出StopIteration 无法继续返回下一个值#可以被_next_()函数调用并不断返回下一个值得对象称为迭代器，Iterator,易特瑞特，迭代器，有_next_()方法才称为迭代器#生成器是迭代器因为它有_next_()方法，迭代器不一定是生成器#生成器是Iterator对象，但list,dict,str虽然是Iterable,却不是Iterator。#把list,dict,str等Iterable变成Iterator可以使用iter()函数。》易特，内置函数#python的迭代器对象是一个数据流（有序序列），可以被next()函数调用不断返回下一个数据，直到没有数据的时候抛出StopIteration#错误，提前不知道序列长度，只能通过next()函数按需计算下一个数据，迭代器计算是惰性（走到这一步才计算）的，只有在需要返回# 下一个数据时它才会计算，#迭代器可以表示一个无限大数据流，如全体自然数，list是由开头结尾的不可能存储全体自然数#作用于for循环的对象是Iterable类型#作用于next（）函数的对象是Iterator类型，表示一个惰性计算序列#isinstance(iter([]),Iterator)#isinstance(iter('abc'),Iterator)it=iter([1,2,3,4,5])while True:    try:        x=next(it)    except StopIteration:        breakprint (x)a=[1,2,3]print (dir(a))#查看所有调用方法from collections import  Iteratorprint (isinstance((x for x in range(5)),Iterator))#生成器，生成器本身就是迭代器

高级的文件、文件夹、压缩包处理模块

import shutilf1=open('本节笔记',encoding='utf-8')f2=open('笔记2','w',encoding='utf-8')import shutilshutil.copyfileobj(open('xo.xml', 'r'), open('new.xml', 'w'))# 将文件内容拷贝到另一个文件中shutil.copyfileobj(f1,f2)#将文件内容拷贝到另一个文件中，可以部分内容shutil.copyfile('笔记2','笔记3')#拷贝文件，笔记2拷贝到笔记3shutil.copymode('笔记2','笔记3')#仅拷贝权限,内容、组、用户均不变shutil.copystat('本节笔记','笔记3')#拷贝状态的信息，包括：mode bits, （atime访问时间）, （mtime其时）, （flags标示）shutil.copy('笔记2','笔记3')#拷贝文件和权限shutil.copy2('笔记2','笔记3')#拷贝文件和状态信息shutil.copytree('test4','new_test4')#递归的去拷贝文件shutil.rmtree('new_test4')#递归的去删除文件shutil.move()#递归的去移动文件shutil.make_archive('shutil_archive_test','zip','path路径')#创建压缩包并返回文件路径，例如：zip、tarimport zipfile#shutil 对压缩包的处理是调用 ZipFile 和 TarFile 两个模块来进行的z=zipfile.ZipFile('day5.zip','w')#压缩z.write('p_test.py')print('-------')z.write('笔记2')z.close()z = zipfile.ZipFile('day5.zip', 'r')# 解压z.extractall()z.close()

转载于:https://www.cnblogs.com/zcok168/p/9142137.html

你可能感兴趣的文章

Cacti监控mysql数据库服务器实现过程

查看>>

Python高级编程–正则表达式（习题）

查看>>

HDU 5742 It's All In The Mind

查看>>