强基初中数学&学Python——第228课 数字和数学第三方模块NumPy:菜鸟入门(4)


索引和切片  可以像索引和切片Python列表一样处理NumPy数组。

>>> data = np.array([1, 2, 3])

>>> data[1]
2
>>> data[0:2]
array([1, 2])
>>> data[1:]
array([2, 3])
>>> data[-2:]
array([2, 3])

  原理图示如下:
  有可能需要获取数组的一部分或特定数组元素,以便在进一步分析或其他操作中使用。这样,就需要对数组进行取子集、切片和/或索引。  使用NumPy很容易从数组中选择满足特定条件的值。  如下数组:

>>> a = np.array([[1 , 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])

  打印出最小的4个值:

print(a[a < 5])
[1 2 3 4]

  又例如,还可以选择等于或大于5的数字,只要使用该条件对数组进行索引。

five_up = (a >= 5)
>>> print(a[five_up])
[ 5  6  7  8  9 10 11 12]

  还可以选出能整除2的元素:

divisible_by_2 = a[a%2==0]
>>> print(divisible_by_2)
[ 2  4  6  8 10 12]

  或者用逻辑连接符&(与)和|(或)选出满足两个条件的元素:

c = a[(a > 2) & (a < 11)]
>>> print(c)
[ 3  4  5  6  7  8  9 10]

  还可以使用逻辑运算符&和|来返回布尔值,该值指定数组中的值是否满足特定条件。这对于包含名称或其他类别值的数组很有用。

five_up = (a > 5) | (a == 5)
>>> print(five_up)
[[False False False False]
 [ True  True  True  True]
 [ True  True  True True]]


  也可以使用np.nonzero()从数组中选择元素或索引。  如下数组:

>>> a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])

  可以用np.nonzero()打印小于5的元素的下标:

>>> b = np.nonzero(a < 5)
>>> print(b)
(array([0, 0, 0, 0]), array([0, 1, 2, 3]))

  在本例中,返回了一个数组元组:每个维度一个。第一个数组表示找到这些值的行索引,第二个数组表示发现这些值的列索引。
  如果要生成元素所在的坐标列表,可以zip这两个数组生成坐标列表,遍历坐标列表并打印它们。例如:

list_of_coordinates= list(zip(b[0], b[1]))

>>> for coord in list_of_coordinates:
...     print(coord)
(0, 0)
(0, 1)
(0, 2)
(0, 3)

  还可以通过np.nonzero()的结果b打印出小于5的元素:

>>> print(a[b])
[1 2 3 4]

  如果数组中不存在要查找的元素,则返回的索引数组将为空。例如:

not_there = np.nonzero(a == 42)
>>> print(not_there)
(array([], dtype=int64), array([], dtype=int64))

  要了解更多有关索引和切片的信息请点https://numpy.org/doc/stable/user/quickstart.html#quickstart-indexing-slicing-and-iterating和https://numpy.org/doc/stable/user/basics.indexing.html#basics-indexing。
  阅读更多关于nonzero函数的信息请打开nonzero:https://numpy.org/doc/stable/reference/generated/numpy.nonzero.html#numpy.nonzero。
如何从现有数据创建数组  介绍切片和索引、np.vstack()、np.hstack()、np.hsplit()、.view()和 copy()。  可以从现有数组的一部分轻松创建新数组。  假设有一个数组:

>>> a = np.array([1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

  通过指定要分割数组的位置,可以随时从数组的一部分创建新数组。

>>> arr1 = a[3:8]
>>> arr1
array([4, 5, 6, 7, 8])

  在上面的程序中,从索引位置3到索引位置8抓取数组的一部分。  还可以垂直和水平堆叠两个现有数组。假设有两个数组a1和a2:

>>> a1 = np.array([[1, 1],
...                [2, 2]])

>>> a2 = np.array([[3, 3],
...                [4, 4]])

  可以用np.vstack()函数垂直堆积它们:

>>> np.vstack((a1, a2))
array([[1, 1],
       [2, 2],
       [3, 3],
       [4, 4]])

或用np.hstack()函数水平堆积它们:

>>> np.hstack((a1, a2))
array([[1, 1, 3, 3],
       [2, 2, 4, 4]])

  可以使用hsplit将一个数组拆分为几个较小的数组。既可以指定要返回的等形状数组的数量,也可以指定要进行除法运算的列。  假设有一个数组:

>>> x = np.arange(1, 25).reshape(2, 12)
>>> x
array([[ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12],
       [13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24]])

  如果要把它分割为三个相同形状(shape)的数组,需要执行:

>>> np.hsplit(x, 3)
  [array([[ 1,  2,  3,  4],
         [13, 14, 15, 16]]), array([[ 5,  6,  7,  8],
         [17, 18, 19, 20]]), array([[ 9, 10, 11, 12],
         [21, 22, 23, 24]])]

  如果要在第三列和第四列之后拆分数组,可以运行:

>>> np.hsplit(x, (3, 4))
  [array([[ 1,  2,  3],
         [13, 14, 15]]), array([[ 4],
         [16]]), array([[ 5,  6,  7,  8,  9, 10, 11, 12],
         [17, 18, 19, 20, 21, 22, 23, 24]])]

  如果要在第三列之后拆分数组,可以运行:

>>> np.hsplit(x, (3, ))
  [array([[ 1,  2,  3],
         [13, 14, 15]]),
         array([[ 4,  5,  6,  7,  8,  9, 10, 11, 12],
         [16, 17, 18, 19, 20, 21, 22, 23, 24]])]

  想了解更多有关堆叠和拆分数组的信息,请打开:https://numpy.org/doc/stable/user/quickstart.html#quickstart-stacking-arrays。  可以使用view方法创建一个新的数组对象,该对象查看与原始数组相同的数据(浅拷贝)。  视图(views)是NumPy的一个重要概念!NumPy函数以及索引和切片等操作将尽可能返回视图。这节省了内存,速度更快(无需复制数据)。但是,必须注意这一点——修改视图中的数据也会修改原始数组!  假设创建了这个数组:

a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])

  现在我们通过切片a创建数组b1,并修改b1的第一个元素。这也将修改a中的相应元素!

>>> b1 = a[0, :]
>>> b1
array([1, 2, 3, 4])
>>> b1[0] = 99
>>> b1
array([99,  2,  3,  4])
>>> a
array([[99,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

  使用copy方法将创建数组及其数据的完整副本(深度副本)。要在数组上使用此功能,可以运行:

>>> b2 = a.copy()

  验证:
  要了解有关copies和views的更多信息,打开https://numpy.org/doc/stable/user/quickstart.html#quickstart-copies-and-views。