Python常用内置模块之random、os、sys、序列化json和subprocess
一、random模块
1.1 随机小数
import random
print(random.random()) # 大于0小于1的小数: 0.5313568399348975
print(random.uniform(1, 3)) # 大于1小于3的小数: 1.2533172911521562
1.2 随机整数
import random
print(random.randint(1, 5)) # 大于等于1且小于等于5之间的整数
print(random.randrange(1, 10, 2)) # 大于等于1且小于10之间的奇数

1.3 随机选择
import random
# 随机选择一个返回
print(random.choice([1, '23', [4, 5]])) # 1或者23或者[4,5]
# 随机选择多个返回,返回的个数为函数的第二个参数
print(random.sample([1, '23', [4, 5]], 2)) # 列表元素任意2个组合
1.4 打乱顺序
import random
# 打乱列表顺序
item = [1, 3, 5, 7, 9]
random.shuffle(item) # 打乱次序
print(item) # [3, 5, 9, 7, 1]
1.5 练习:生成随机验证码
import random
def get_code(n):
lis = [(48, 57), (65, 90), (97, 122)]
yzm_str = ''
for i in range(n):
num = random.randint(*random.choice(lis))
yzm_str += chr(num)
return yzm_str
print(get_code(5))

二、os模块
os模块是与操作系统交互的一个接口。
2.1 创建目录
import os
os.makedirs('dirname1/dirname2') # 可生成多层递归目录
os.mkdir('dirname') # 生成单级目录;相当于shell中mkdir dirname
2.2 删除目录
import os
os.removedirs('dirname1') # 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.rmdir('dirname') # 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
删除一个文件:
os.remove('待删除文件')
2.3 重名名文件/目录
import os
os.rename("dirname", "newname") # 重命名文件/目录
2.4 获取信息相关
import os
print(os.listdir()) # 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
print(os.stat('os模块.py')) # 获取文件/目录信息
print(os.getcwd()) # 获取当前工作目录,即当前Python脚本工作的目录路径
注意:os.stat('path/filename'):获取文件/目录信息 的结构说明
stat 结构:
st_mode: inode 保护模式
st_ino: inode 节点号。
st_dev: inode 驻留的设备。
st_nlink: inode 的链接数。
st_uid: 所有者的用户ID。
st_gid: 所有者的组ID。
st_size: 普通文件以字节为单位的大小;包含等待某些特殊文件的数据。
st_atime: 上次访问的时间。
st_mtime: 最后一次修改的时间。
st_ctime: 由操作系统报告的"ctime"。在某些系统上(如Unix)是最新的元数据更改的时间,在其它系统上(如Windows)是创建时间(详细信息参见平台的文档)。
os.sep 输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"
os.linesep 输出当前平台使用的行终止符,win下为"\r\n",Linux下为"\n"
os.pathsep 输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name 输出字符串指示当前使用平台。win->'nt'; Linux->'posix'

2.5 shell命令相关
import os
os.system("bash command") # 运行shell命令,直接显示
os.popen("bash command").read() # 运行shell命令,获取执行结果
os.chdir("dirname") # 切换当前脚本工作目录;相当于shell下cd
2.6 os.path系列
import os
os.path.abspath('dirname1') # 返回path规范化的绝对路径
os.path.split('path') # 将path分割成目录和文件名以元组返回
os.path.dirname('path') 返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename('path') # 返回path最后的文件名。如果path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists('path') 如果path存在,返回True;如果path不存在,返回False
os.path.isabs('path') # 如果path是绝对路径,返回True
os.path.isfile('path') 如果path是一个存在的文件,返回True。否则返回False
os.path.isdir('path') 如果path是一个存在的目录,则返回True。否则返回False
os.path.join('path1', 'path2', ...) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime('path') # 返回path所指向的文件或者目录的最后访问时间
os.path.getmtime('path') # 返回path所指向的文件或者目录的最后修改时间
os.path.getsize('path') 返回path的大小(字节数)

三、sys模块
sys模块是与Python解释器交互的一个接口。
sys.argv 命令行参数List,第一个元素是程序本身路径
sys.exit(n) 退出程序,正常退出时exit(0),错误退出sys.exit(1)
sys.version 获取Python解释程序的版本信息
sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform 返回操作系统平台名称
sys.argv使用场景:
import sys
try:
username = sys.argv[1]
password = sys.argv[2]
if username == 'jason' and password == '123':
print('正常执行文件内容')
else:
print('用户名或密码错误')
except Exception:
print('请输入用户名和密码')
print('目前只能让你体验一下(游客模式)')
sys.exit:
import sys
try:
sys.exit(1)
except SystemExit as e:
print(e)

四、序列化与json模块
4.1 什么叫序列化
将原本的字典、列表等内容转换成一个字符串的过程就叫做序列化。
4.2 为什么要有序列化模块
比如,我们在Python代码中计算的一个数据需要给另外一段程序使用,那我们怎么给?
现在我们能想到的方法就是存在文件里,然后另一个Python程序再从文件里读出来。
但是我们都知道,对于文件来说是没有字典这个概念的,所以我们只能将数据转换成字符串形式放到文件中。
你一定会问,将字典转换成一个字符串很简单,就是str(dic)就可以办到了,为什么我们还要使用序列化模块呢?
没错序列化的过程就是从dic 变成str(dic)的过程。现在你可以通过str(dic),将一个名为dic的字典转换成一个字符串;但是你要怎么把一个字符串转换成字典呢?
聪明的你可能想到了eval(),如果我们将一个字符串类型的字典str_dic传给eval,就会得到一个返回的字典类型了。
eval()函数十分强大,但是eval是做什么的?e官方demo解释为:将字符串str当成有效的表达式来求值并返回计算结果。BUT!强大的函数有代价。安全性是其最大的缺点。
想象一下,如果我们从文件中读出的不是一个数据结构,而是一句"删除文件"类似的破坏性语句,那么后果实在不堪设设想,而使用eval就要担这个风险。
所以,我们并不推荐用eval方法来进行反序列化操作(将str转换成Python中的数据结构)

4.3 序列化的目的
- 以某种存储形式使自定义对象持久化;
- 将对象从一个地方传递到另一个地方;
- 使程序更具维护性;
4.4 json模块
json模块提供了四个功能:dumps、loads、dump、load。
4.4.1 dumps和loads
import json
dic = {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
str_dic = json.dumps(dic) # 序列化:将一个字典转换成一个字符串
print(str_dic, type(str_dic)) # {"k1": "v1", "k2": "v2", "k3": "v3"}
"""注意,json转换完的字符串类型的字典中的字符串是由""表示的"""
dic2 = json.loads(str_dic) # 反序列化:将一个字符串格式的字典转换成一个字典数据类型
print(dic2, type(dic2)) # {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
"""注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示"""
也可以处理嵌套的数据类型:
import json
list_dic = [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]
str_dic = json.dumps(list_dic)
print(str_dic, type(str_dic)) # [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}]
list_dic2 = json.loads(str_dic)
print(list_dic2, type(list_dic2)) # [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]
4.4.2 dump和load
import json
dic = {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
with open(r'json_file', 'w', encoding='utf8') as f:
json.dump(dic, f) # dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
with open(r'json_file', 'r', encoding='utf8') as f:
dic2 = json.load(f) # load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
print(dic2, type(dic2)) # {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}

4.4.3 ensure_ascii关键字参数
import json
with open(r'file', 'w', encoding='utf8') as f:
json.dump({'国籍': '中国'}, f)
ret = json.dumps({'国籍': '中国'})
f.write(ret + '\n')
json.dump({'国籍': '美国'}, f, ensure_ascii=False)
ret1 = json.dumps({'国籍': '美国'}, ensure_ascii=False)
f.write(ret1 + '\n')
程序执行完file文件内容:
{"\u56fd\u7c4d": "\u4e2d\u56fd"}{"\u56fd\u7c4d": "\u4e2d\u56fd"}
{"国籍": "美国"}{"国籍": "美国"}
4.4.4 其他参数说明
- Skipkeys:默认值是False,如果dict的keys内的数据不是python的基本类型(str,unicode,int,long,float,bool,None),设置为False时,就会报TypeError的错误。此时设置成True,则会跳过这类key
- ensure_ascii:,当它为True的时候,所有非ASCII码字符显示为\uXXXX序列,只需在dump时将ensure_ascii设置为False即可,此时存入json的中文即可正常显示。
- indent:应该是一个非负的整型,如果是0就是顶格分行显示,如果为空就是一行最紧凑显示,否则会换行且按照indent的数值显示前面的空白分行显示,这样打印出来的json数据也叫pretty-printed json
- separators:分隔符,实际上是(item_separator, dict_separator)的一个元组,默认的就是(‘,’,‘:’);这表示dictionary内keys之间用“,”隔开,而KEY和value之间用“:”隔开。
sort_keys:将数据根据keys的值进行排序。
4.4.5 json格式化输出
import json
data = {'username': ['李华', '二愣子'], 'sex': 'male', 'age': 16}
json_dic2 = json.dumps(data, sort_keys=True, indent=2, separators=(',', ':'), ensure_ascii=False)
print(json_dic2)
打印结果为:
{
"age":16,
"sex":"male",
"username":[
"李华",
"二愣子"
]
}
注意:并不是所有的数据类型都支持序列化。
json.JSONEncoder——查看支持的数据类型

五、subprocess模块
import subprocess
"""
1.可以基于网络连接上一台计算机(socket模块)
2.让连接上的计算机执行我们需要执行的命令
3.将命令的结果返回
"""
res = subprocess.Popen('tasklist',
shell=True,
stdout=subprocess.PIPE,
stderr=subprocess.PIPE
)
print('stdout', res.stdout.read().decode('gbk')) # 获取正确命令执行之后的结果
print('stderr', res.stderr.read().decode('gbk')) # 获取错误命令执行之后的结果
"""
windows电脑内部编码默认为GBK
"""
