numpy学习Ⅱ


今天有空再把numpy看一下,补充点不会的,再去看matplotlib


回顾之前笔记,发现之前的numpy学习Ⅰ中关于numpy的行、列、维可能表述有点不清晰,这里再叙述一下

import numpy as np
c = np.array([[[1,2],[1,2]],[[1,2],[0,0]],[[3,4],[5,6]],[[7,8],[9,0]]])
print("c:",c)
print("c.ndim:",c.ndim)
print("c.shape:",c.shape)

这里我们可以看成c有4个平面,每个平面2*2规模,实际上的维度为3

c: [[[1 2]
  [1 2]]

 [[1 2]
  [0 0]]

 [[3 4]
  [5 6]]

 [[7 8]
  [9 0]]]
c.ndim: 3
c.shape: (4, 2, 2)

上次学习了np.dtype创建新的数据类型,理解是理解了,但是过了一星期忘了怎么写,这里先回顾一下

当我们在numpy中创建自己的np.array,并且指定数据类型时,就需要使用np.dtype,首先看最简单的

  1. 直接使用dtype类型
import numpy as np
sex = np.dtype('int32')
a = np.array([1,2,3,4],dtype=sex)
print("sex:",sex)
print("a:",a)
sex: int32
a: [1 2 3 4]

也就是说我们指定sex的类型为int32类型,并且我们创建新的ndarray时指定数据类型

同时,int32我们可以用'i4'来代替

  1. 在最基础类型上,使用简写替代
import numpy as np
# int8, int16, int32, int64 四种数据类型可以使用字符串 'i1', 'i2','i4','i8' 代替
dt = np.dtype('i4')
print("dt:",dt)
b = np.array([5,6,7,8],dtype=dt)
print("b:",b)
dt: int32
b: [5 6 7 8]

这时候我们想使用结构化数据类型了

  1. 结构化,好处是可以到时候通过结构再调用(我猜的)
# 类型字段名可以用于存取实际的 age 列
import numpy as np
dt = np.dtype([('age',np.int8)]) 
a = np.array([(10,),(20,),(30,)], dtype = dt) 
print("a:",a)
print("虽然我也很想直接使用a.age,但这里只能使用a['age']:",a['age'])
a: [(10,) (20,) (30,)]
虽然我也很想直接使用a.age,但这里只能使用a['age']: [10 20 30]

学到这里时再总结一下,np.array创建数组时,传入的是一个列表,或者说是张量,然后数组中每一行的列数对应我们创建数据类型的个数,听起来很绕,看下面的例子

  1. 创建复杂类型结构化数据
import numpy as np
student = np.dtype([('name','U2'), ('age', 'i4'), ('marks', 'f4')]) 
a = np.array([('abc', 21, 50.),('xyz', 18, 75.)], dtype = student) 
print("studet:",student)
print("a:",a)
print("a['name']:",a["name"])
print("a['age']:",a['age'])
print("a['markd:']:",a["marks"])
studet: [('name', '

这里刻意写的U2,且原来的abc变成了ab,也可以试一下S3看一下结果

itemsize返回数组中每一个元素的大小

import numpy as np 
 
# 数组的 dtype 为 int8(一个字节)  
x = np.array([1,2,3,4,5], dtype = np.int8)  
print (x.itemsize)
 
# 数组的 dtype 现在为 float64(八个字节) 
y = np.array([1,2,3,4,5], dtype = np.float64)  
print (y.itemsize)
1
8

回头看的时候发现numpy有个创建等比数列的函数,这里思考了一下首先用普通函数的方法实现

def proportional(n,m):
    list1 = []
    for i in range(n):
        temp = m**i
        list1.append(temp)
    return list1
result = dengbi(10,1.5)
print(result)

[1.0, 1.5, 2.25, 3.375, 5.0625, 7.59375, 11.390625, 17.0859375, 25.62890625, 38.443359375]

然后logspace函数主要是起点、终点、数目,底数

import numpy as np
a = np.logspace(0,9,10,base=2)
print (a)

[  1.   2.   4.   8.  16.  32.  64. 128. 256. 512.]

在之前的numpy学习中,也学习了解了一些获取数组中元素的方法,但是很混乱,这里再次总结一下

  1. 获取单个元素
import numpy as np
a = np.array([[[1,2],[1,2]],[[3,4],[5,6]],[[7,8],[9,10]],[[11,12],[13,14]]])
print("a:",a)
print("a[0,0,0]:",a[0,0,0])
print("a[0][0][0]:",a[0][0][0])
print("a[1][1][1]",a[1][1][1])
print("合起来的a[0][0][0]和a[1][1][1]:",a[(0,1),(0,1),(0,1)])
print("合起来的a[0][0][0]和a[1][1][1]:",a[[0,1],[0,1],[0,1]])

这里现在掌握了这两种方法,花里胡哨的还没掌握

  1. 获取行或者列
import numpy as np
 
a = np.array([[1,2,3], [4,5,6],[7,8,9]])
b = a[1:3, 1:3]
c = a[1:3,[1,2]]
d = a[...,1:]
print(b)
print(c)
print(d)

主要是通过:+,这样的组合来进行获取

  1. 条件索引
import numpy as np 
 
x = np.array([[  0,  1,  2],[  3,  4,  5],[  6,  7,  8],[  9,  10,  11]])  
print ('我们的数组是:')
print (x)
print ('\n')
# 现在我们会打印出大于 5 的元素  
print  ('大于 5 的元素是:')
print (x[x >  5])

目前就先掌握这三种索引了


一开始并不清楚nditer是干嘛的,但当我遇到这个问题,遍历一个ndarray。numpy创建的数组是可迭代的,但是默认是按行进行,如果想一个一个进行输出,那么需使用nditer

import numpy as np
 
a = np.arange(6).reshape(2,3)
print ('原始数组是:')
print (a)
print ('\n')
print ('迭代输出元素:')
for x in np.nditer(a):
    print (x, end=", " )
print ('\n')
原始数组是:
[[0 1 2]
 [3 4 5]]


迭代输出元素:
0, 1, 2, 3, 4, 5, 

numpy的迭代,弄懂了一些,但还是有一些不明白,先记录下来

import numpy as np
 
a = np.arange(0,60,5) 
a = a.reshape(3,4)  
print ('原始数组是:')
print (a)
print ('\n')
for x in np.nditer(a, op_flags=['readwrite']): 
    x[...]=2*x 
print ('修改后的数组是:')
print (a)

第一次接触到python的... 这里的... 表示如果a里面有1个元素,那么就补齐1个元素,如果有数组,那么就补齐数组

import numpy as np
d = np.array([[[i + 2*j + 8*k for i in range(3)] for j in range(3)] for k in range(3)])
print(d)
print(d[...,0])
print(d[0,...])
print(d[...,0,:])

这里是对不同维度进行切片

若想对不同维度进行最大值取值,可以用amax函数