Python常用内置模块之random、os、sys、序列化json和subprocess


一、random模块

1.1 随机小数

import random

print(random.random())  # 大于0小于1的小数: 0.5313568399348975
print(random.uniform(1, 3))  # 大于1小于3的小数: 1.2533172911521562

1.2 随机整数

import random

print(random.randint(1, 5))  # 大于等于1且小于等于5之间的整数
print(random.randrange(1, 10, 2))  # 大于等于1且小于10之间的奇数

1.3 随机选择

import random

# 随机选择一个返回
print(random.choice([1, '23', [4, 5]]))  # 1或者23或者[4,5]
# 随机选择多个返回,返回的个数为函数的第二个参数
print(random.sample([1, '23', [4, 5]], 2))  # 列表元素任意2个组合

1.4 打乱顺序

import random

# 打乱列表顺序
item = [1, 3, 5, 7, 9]
random.shuffle(item)  # 打乱次序
print(item)  # [3, 5, 9, 7, 1]

1.5 练习:生成随机验证码

import random

def get_code(n):
    lis = [(48, 57), (65, 90), (97, 122)]
    yzm_str = ''
    for i in range(n):
        num = random.randint(*random.choice(lis))
        yzm_str += chr(num)
    return yzm_str

print(get_code(5))

二、os模块

os模块是与操作系统交互的一个接口。

2.1 创建目录

import os

os.makedirs('dirname1/dirname2')  # 可生成多层递归目录
os.mkdir('dirname')  # 生成单级目录;相当于shell中mkdir dirname

2.2 删除目录

import os

os.removedirs('dirname1')  # 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.rmdir('dirname')  # 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname

删除一个文件:

os.remove('待删除文件') 

2.3 重名名文件/目录

import os

os.rename("dirname", "newname")  # 重命名文件/目录

2.4 获取信息相关

import os

print(os.listdir())  # 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
print(os.stat('os模块.py'))  # 获取文件/目录信息
print(os.getcwd())  # 获取当前工作目录,即当前Python脚本工作的目录路径

注意:os.stat('path/filename'):获取文件/目录信息 的结构说明

stat 结构:

st_mode: inode 保护模式
st_ino: inode 节点号。
st_dev: inode 驻留的设备。
st_nlink: inode 的链接数。
st_uid: 所有者的用户ID。
st_gid: 所有者的组ID。
st_size: 普通文件以字节为单位的大小;包含等待某些特殊文件的数据。
st_atime: 上次访问的时间。
st_mtime: 最后一次修改的时间。
st_ctime: 由操作系统报告的"ctime"。在某些系统上(如Unix)是最新的元数据更改的时间,在其它系统上(如Windows)是创建时间(详细信息参见平台的文档)。
os.sep    输出操作系统特定的路径分隔符,win下为"\\",Linux下为"/"
os.linesep    输出当前平台使用的行终止符,win下为"\r\n",Linux下为"\n"
os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'

2.5 shell命令相关

import os

os.system("bash command")  # 运行shell命令,直接显示
os.popen("bash command").read()  # 运行shell命令,获取执行结果
os.chdir("dirname")  # 切换当前脚本工作目录;相当于shell下cd

2.6 os.path系列

import os

os.path.abspath('dirname1')  # 返回path规范化的绝对路径
os.path.split('path')  # 将path分割成目录和文件名以元组返回
os.path.dirname('path')  返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename('path')  # 返回path最后的文件名。如果path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists('path')  如果path存在,返回True;如果path不存在,返回False
os.path.isabs('path')  # 如果path是绝对路径,返回True
os.path.isfile('path')  如果path是一个存在的文件,返回True。否则返回False
os.path.isdir('path')  如果path是一个存在的目录,则返回True。否则返回False
os.path.join('path1', 'path2', ...)  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime('path')  # 返回path所指向的文件或者目录的最后访问时间
os.path.getmtime('path')  # 返回path所指向的文件或者目录的最后修改时间
os.path.getsize('path')  返回path的大小(字节数)

三、sys模块

sys模块是与Python解释器交互的一个接口。

sys.argv           命令行参数List,第一个元素是程序本身路径
sys.exit(n)        退出程序,正常退出时exit(0),错误退出sys.exit(1)
sys.version        获取Python解释程序的版本信息
sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform       返回操作系统平台名称

sys.argv使用场景:

import sys

try:
    username = sys.argv[1]
    password = sys.argv[2]
    if username == 'jason' and password == '123':
        print('正常执行文件内容')
    else:
        print('用户名或密码错误')
except Exception:
    print('请输入用户名和密码')
    print('目前只能让你体验一下(游客模式)')

sys.exit:

import sys

try:
    sys.exit(1)
except SystemExit as e:
    print(e)

四、序列化与json模块

4.1 什么叫序列化

将原本的字典、列表等内容转换成一个字符串的过程就叫做序列化

4.2 为什么要有序列化模块

比如,我们在Python代码中计算的一个数据需要给另外一段程序使用,那我们怎么给?
现在我们能想到的方法就是存在文件里,然后另一个Python程序再从文件里读出来。
但是我们都知道,对于文件来说是没有字典这个概念的,所以我们只能将数据转换成字符串形式放到文件中。

你一定会问,将字典转换成一个字符串很简单,就是str(dic)就可以办到了,为什么我们还要使用序列化模块呢?

没错序列化的过程就是从dic 变成str(dic)的过程。现在你可以通过str(dic),将一个名为dic的字典转换成一个字符串;但是你要怎么把一个字符串转换成字典呢?

聪明的你可能想到了eval(),如果我们将一个字符串类型的字典str_dic传给eval,就会得到一个返回的字典类型了。
eval()函数十分强大,但是eval是做什么的?e官方demo解释为:将字符串str当成有效的表达式来求值并返回计算结果。BUT!强大的函数有代价。安全性是其最大的缺点。

想象一下,如果我们从文件中读出的不是一个数据结构,而是一句"删除文件"类似的破坏性语句,那么后果实在不堪设设想,而使用eval就要担这个风险。
所以,我们并不推荐用eval方法来进行反序列化操作(将str转换成Python中的数据结构)

4.3 序列化的目的

  1. 以某种存储形式使自定义对象持久化;
  2. 将对象从一个地方传递到另一个地方;
  3. 使程序更具维护性;

4.4 json模块

json模块提供了四个功能:dumps、loads、dump、load。

4.4.1 dumps和loads
import json

dic = {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
str_dic = json.dumps(dic)  # 序列化:将一个字典转换成一个字符串
print(str_dic, type(str_dic))  # {"k1": "v1", "k2": "v2", "k3": "v3"} 
"""注意,json转换完的字符串类型的字典中的字符串是由""表示的"""

dic2 = json.loads(str_dic)  # 反序列化:将一个字符串格式的字典转换成一个字典数据类型
print(dic2, type(dic2))  # {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'} 
"""注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示"""

也可以处理嵌套的数据类型:

import json

list_dic = [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]
str_dic = json.dumps(list_dic)
print(str_dic, type(str_dic))  # [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}] 
list_dic2 = json.loads(str_dic)
print(list_dic2, type(list_dic2))  # [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}] 
4.4.2 dump和load
import json

dic = {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
with open(r'json_file', 'w', encoding='utf8') as f:
    json.dump(dic, f)  # dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件

with open(r'json_file', 'r', encoding='utf8') as f:
    dic2 = json.load(f)  # load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回

print(dic2, type(dic2))  # {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'} 
4.4.3 ensure_ascii关键字参数
import json

with open(r'file', 'w', encoding='utf8') as f:
    json.dump({'国籍': '中国'}, f)
    ret = json.dumps({'国籍': '中国'})
    f.write(ret + '\n')
    json.dump({'国籍': '美国'}, f, ensure_ascii=False)
    ret1 = json.dumps({'国籍': '美国'}, ensure_ascii=False)
    f.write(ret1 + '\n')

程序执行完file文件内容:

{"\u56fd\u7c4d": "\u4e2d\u56fd"}{"\u56fd\u7c4d": "\u4e2d\u56fd"}
{"国籍": "美国"}{"国籍": "美国"}
4.4.4 其他参数说明
  • Skipkeys:默认值是False,如果dict的keys内的数据不是python的基本类型(str,unicode,int,long,float,bool,None),设置为False时,就会报TypeError的错误。此时设置成True,则会跳过这类key
  • ensure_ascii:,当它为True的时候,所有非ASCII码字符显示为\uXXXX序列,只需在dump时将ensure_ascii设置为False即可,此时存入json的中文即可正常显示。
  • indent:应该是一个非负的整型,如果是0就是顶格分行显示,如果为空就是一行最紧凑显示,否则会换行且按照indent的数值显示前面的空白分行显示,这样打印出来的json数据也叫pretty-printed json
  • separators:分隔符,实际上是(item_separator, dict_separator)的一个元组,默认的就是(‘,’,‘:’);这表示dictionary内keys之间用“,”隔开,而KEY和value之间用“:”隔开。
    sort_keys:将数据根据keys的值进行排序。
4.4.5 json格式化输出
import json

data = {'username': ['李华', '二愣子'], 'sex': 'male', 'age': 16}
json_dic2 = json.dumps(data, sort_keys=True, indent=2, separators=(',', ':'), ensure_ascii=False)
print(json_dic2)

打印结果为:

{
  "age":16,
  "sex":"male",
  "username":[
    "李华",
    "二愣子"
  ]
}

注意:并不是所有的数据类型都支持序列化。

json.JSONEncoder——查看支持的数据类型

五、subprocess模块

import subprocess

"""
1.可以基于网络连接上一台计算机(socket模块)
2.让连接上的计算机执行我们需要执行的命令
3.将命令的结果返回
"""
res = subprocess.Popen('tasklist',
                       shell=True,
                       stdout=subprocess.PIPE,
                       stderr=subprocess.PIPE
                       )
print('stdout', res.stdout.read().decode('gbk'))  # 获取正确命令执行之后的结果
print('stderr', res.stderr.read().decode('gbk'))  # 获取错误命令执行之后的结果
"""
windows电脑内部编码默认为GBK
"""