numpy学习Ⅱ
今天有空再把numpy看一下,补充点不会的,再去看matplotlib
回顾之前笔记,发现之前的numpy学习Ⅰ
中关于numpy的行、列、维可能表述有点不清晰,这里再叙述一下
import numpy as np
c = np.array([[[1,2],[1,2]],[[1,2],[0,0]],[[3,4],[5,6]],[[7,8],[9,0]]])
print("c:",c)
print("c.ndim:",c.ndim)
print("c.shape:",c.shape)
这里我们可以看成c有4个平面,每个平面2*2规模,实际上的维度为3
c: [[[1 2]
[1 2]]
[[1 2]
[0 0]]
[[3 4]
[5 6]]
[[7 8]
[9 0]]]
c.ndim: 3
c.shape: (4, 2, 2)
上次学习了np.dtype创建新的数据类型,理解是理解了,但是过了一星期忘了怎么写,这里先回顾一下
当我们在numpy中创建自己的np.array,并且指定数据类型时,就需要使用np.dtype,首先看最简单的
- 直接使用dtype类型
import numpy as np
sex = np.dtype('int32')
a = np.array([1,2,3,4],dtype=sex)
print("sex:",sex)
print("a:",a)
sex: int32
a: [1 2 3 4]
也就是说我们指定sex的类型为int32
类型,并且我们创建新的ndarray时指定数据类型
同时,int32我们可以用'i4'来代替
- 在最基础类型上,使用简写替代
import numpy as np
# int8, int16, int32, int64 四种数据类型可以使用字符串 'i1', 'i2','i4','i8' 代替
dt = np.dtype('i4')
print("dt:",dt)
b = np.array([5,6,7,8],dtype=dt)
print("b:",b)
dt: int32
b: [5 6 7 8]
这时候我们想使用结构化数据类型了
- 结构化,好处是可以到时候通过结构再调用
(我猜的)
# 类型字段名可以用于存取实际的 age 列
import numpy as np
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print("a:",a)
print("虽然我也很想直接使用a.age,但这里只能使用a['age']:",a['age'])
a: [(10,) (20,) (30,)]
虽然我也很想直接使用a.age,但这里只能使用a['age']: [10 20 30]
学到这里时再总结一下,np.array创建数组时,传入的是一个列表,或者说是张量
,然后数组中每一行的列数对应我们创建数据类型的个数,听起来很绕,看下面的例子
- 创建复杂类型结构化数据
import numpy as np
student = np.dtype([('name','U2'), ('age', 'i4'), ('marks', 'f4')])
a = np.array([('abc', 21, 50.),('xyz', 18, 75.)], dtype = student)
print("studet:",student)
print("a:",a)
print("a['name']:",a["name"])
print("a['age']:",a['age'])
print("a['markd:']:",a["marks"])
studet: [('name', '
这里刻意写的U2,且原来的abc
变成了ab
,也可以试一下S3看一下结果
itemsize返回数组中每一个元素的大小
import numpy as np
# 数组的 dtype 为 int8(一个字节)
x = np.array([1,2,3,4,5], dtype = np.int8)
print (x.itemsize)
# 数组的 dtype 现在为 float64(八个字节)
y = np.array([1,2,3,4,5], dtype = np.float64)
print (y.itemsize)
1
8
回头看的时候发现numpy有个创建等比数列的函数,这里思考了一下首先用普通函数的方法实现
def proportional(n,m):
list1 = []
for i in range(n):
temp = m**i
list1.append(temp)
return list1
result = dengbi(10,1.5)
print(result)
[1.0, 1.5, 2.25, 3.375, 5.0625, 7.59375, 11.390625, 17.0859375, 25.62890625, 38.443359375]
然后logspace函数主要是起点、终点、数目,底数
import numpy as np
a = np.logspace(0,9,10,base=2)
print (a)
[ 1. 2. 4. 8. 16. 32. 64. 128. 256. 512.]
在之前的numpy学习中,也学习了解了一些获取数组中元素的方法,但是很混乱,这里再次总结一下
- 获取单个元素
import numpy as np
a = np.array([[[1,2],[1,2]],[[3,4],[5,6]],[[7,8],[9,10]],[[11,12],[13,14]]])
print("a:",a)
print("a[0,0,0]:",a[0,0,0])
print("a[0][0][0]:",a[0][0][0])
print("a[1][1][1]",a[1][1][1])
print("合起来的a[0][0][0]和a[1][1][1]:",a[(0,1),(0,1),(0,1)])
print("合起来的a[0][0][0]和a[1][1][1]:",a[[0,1],[0,1],[0,1]])
这里现在掌握了这两种方法,花里胡哨的还没掌握
- 获取行或者列
import numpy as np
a = np.array([[1,2,3], [4,5,6],[7,8,9]])
b = a[1:3, 1:3]
c = a[1:3,[1,2]]
d = a[...,1:]
print(b)
print(c)
print(d)
主要是通过:+,这样的组合来进行获取
- 条件索引
import numpy as np
x = np.array([[ 0, 1, 2],[ 3, 4, 5],[ 6, 7, 8],[ 9, 10, 11]])
print ('我们的数组是:')
print (x)
print ('\n')
# 现在我们会打印出大于 5 的元素
print ('大于 5 的元素是:')
print (x[x > 5])
目前就先掌握这三种索引了
一开始并不清楚nditer是干嘛的,但当我遇到这个问题,遍历一个ndarray。numpy创建的数组是可迭代的,但是默认是按行进行,如果想一个一个进行输出,那么需使用nditer
import numpy as np
a = np.arange(6).reshape(2,3)
print ('原始数组是:')
print (a)
print ('\n')
print ('迭代输出元素:')
for x in np.nditer(a):
print (x, end=", " )
print ('\n')
原始数组是:
[[0 1 2]
[3 4 5]]
迭代输出元素:
0, 1, 2, 3, 4, 5,
numpy的迭代,弄懂了一些,但还是有一些不明白,先记录下来
import numpy as np
a = np.arange(0,60,5)
a = a.reshape(3,4)
print ('原始数组是:')
print (a)
print ('\n')
for x in np.nditer(a, op_flags=['readwrite']):
x[...]=2*x
print ('修改后的数组是:')
print (a)
第一次接触到python的...
这里的...
表示如果a里面有1个元素,那么就补齐1个元素,如果有数组,那么就补齐数组
import numpy as np
d = np.array([[[i + 2*j + 8*k for i in range(3)] for j in range(3)] for k in range(3)])
print(d)
print(d[...,0])
print(d[0,...])
print(d[...,0,:])
这里是对不同维度进行切片
若想对不同维度进行最大值取值,可以用amax函数