索引和切片 可以像索引和切片Python列表一样处理NumPy数组。
>>> data = np.array([1, 2, 3])
>>> data[1]
2
>>> data[0:2]
array([1, 2])
>>> data[1:]
array([2, 3])
>>> data[-2:]
array([2, 3])
原理图示如下:
有可能需要获取数组的一部分或特定数组元素,以便在进一步分析或其他操作中使用。这样,就需要对数组进行取子集、切片和/或索引。 使用NumPy很容易从数组中选择满足特定条件的值。 如下数组:
>>> a = np.array([[1 , 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
打印出最小的4个值:
print(a[a < 5])
[1 2 3 4]
又例如,还可以选择等于或大于5的数字,只要使用该条件对数组进行索引。
five_up = (a >= 5)
>>> print(a[five_up])
[ 5 6 7 8 9 10 11 12]
还可以选出能整除2的元素:
divisible_by_2 = a[a%2==0]
>>> print(divisible_by_2)
[ 2 4 6 8 10 12]
或者用逻辑连接符&(与)和|(或)选出满足两个条件的元素:
c = a[(a > 2) & (a < 11)]
>>> print(c)
[ 3 4 5 6 7 8 9 10]
还可以使用逻辑运算符&和|来返回布尔值,该值指定数组中的值是否满足特定条件。这对于包含名称或其他类别值的数组很有用。
five_up = (a > 5) | (a == 5)
>>> print(five_up)
[[False False False False]
[ True True True True]
[ True True True True]]
也可以使用np.nonzero()从数组中选择元素或索引。 如下数组:
>>> a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
可以用np.nonzero()打印小于5的元素的下标:
>>> b = np.nonzero(a < 5)
>>> print(b)
(array([0, 0, 0, 0]), array([0, 1, 2, 3]))
在本例中,返回了一个数组元组:每个维度一个。第一个数组表示找到这些值的行索引,第二个数组表示发现这些值的列索引。
如果要生成元素所在的坐标列表,可以zip这两个数组生成坐标列表,遍历坐标列表并打印它们。例如:
list_of_coordinates= list(zip(b[0], b[1]))
>>> for coord in list_of_coordinates:
... print(coord)
(0, 0)
(0, 1)
(0, 2)
(0, 3)
还可以通过np.nonzero()的结果b打印出小于5的元素:
>>> print(a[b])
[1 2 3 4]
如果数组中不存在要查找的元素,则返回的索引数组将为空。例如:
not_there = np.nonzero(a == 42)
>>> print(not_there)
(array([], dtype=int64), array([], dtype=int64))
要了解更多有关索引和切片的信息请点https://numpy.org/doc/stable/user/quickstart.html#quickstart-indexing-slicing-and-iterating和https://numpy.org/doc/stable/user/basics.indexing.html#basics-indexing。
阅读更多关于nonzero函数的信息请打开nonzero:https://numpy.org/doc/stable/reference/generated/numpy.nonzero.html#numpy.nonzero。
如何从现有数据创建数组 介绍切片和索引、np.vstack()、np.hstack()、np.hsplit()、.view()和 copy()。 可以从现有数组的一部分轻松创建新数组。 假设有一个数组:
>>> a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
通过指定要分割数组的位置,可以随时从数组的一部分创建新数组。
>>> arr1 = a[3:8]
>>> arr1
array([4, 5, 6, 7, 8])
在上面的程序中,从索引位置3到索引位置8抓取数组的一部分。 还可以垂直和水平堆叠两个现有数组。假设有两个数组a1和a2:
>>> a1 = np.array([[1, 1],
... [2, 2]])
>>> a2 = np.array([[3, 3],
... [4, 4]])
可以用np.vstack()函数垂直堆积它们:
>>> np.vstack((a1, a2))
array([[1, 1],
[2, 2],
[3, 3],
[4, 4]])
或用np.hstack()函数水平堆积它们:
>>> np.hstack((a1, a2))
array([[1, 1, 3, 3],
[2, 2, 4, 4]])
可以使用hsplit将一个数组拆分为几个较小的数组。既可以指定要返回的等形状数组的数量,也可以指定要进行除法运算的列。 假设有一个数组:
>>> x = np.arange(1, 25).reshape(2, 12)
>>> x
array([[ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
[13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24]])
如果要把它分割为三个相同形状(shape)的数组,需要执行:
>>> np.hsplit(x, 3)
[array([[ 1, 2, 3, 4],
[13, 14, 15, 16]]), array([[ 5, 6, 7, 8],
[17, 18, 19, 20]]), array([[ 9, 10, 11, 12],
[21, 22, 23, 24]])]
如果要在第三列和第四列之后拆分数组,可以运行:
>>> np.hsplit(x, (3, 4))
[array([[ 1, 2, 3],
[13, 14, 15]]), array([[ 4],
[16]]), array([[ 5, 6, 7, 8, 9, 10, 11, 12],
[17, 18, 19, 20, 21, 22, 23, 24]])]
如果要在第三列之后拆分数组,可以运行:
>>> np.hsplit(x, (3, ))
[array([[ 1, 2, 3],
[13, 14, 15]]),
array([[ 4, 5, 6, 7, 8, 9, 10, 11, 12],
[16, 17, 18, 19, 20, 21, 22, 23, 24]])]
想了解更多有关堆叠和拆分数组的信息,请打开:https://numpy.org/doc/stable/user/quickstart.html#quickstart-stacking-arrays。 可以使用view方法创建一个新的数组对象,该对象查看与原始数组相同的数据(浅拷贝)。 视图(views)是NumPy的一个重要概念!NumPy函数以及索引和切片等操作将尽可能返回视图。这节省了内存,速度更快(无需复制数据)。但是,必须注意这一点——修改视图中的数据也会修改原始数组! 假设创建了这个数组:
a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
现在我们通过切片a创建数组b1,并修改b1的第一个元素。这也将修改a中的相应元素!
>>> b1 = a[0, :]
>>> b1
array([1, 2, 3, 4])
>>> b1[0] = 99
>>> b1
array([99, 2, 3, 4])
>>> a
array([[99, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 11, 12]])
使用copy方法将创建数组及其数据的完整副本(深度副本)。要在数组上使用此功能,可以运行:
>>> b2 = a.copy()
验证:
要了解有关copies和views的更多信息,打开https://numpy.org/doc/stable/user/quickstart.html#quickstart-copies-and-views。