NumPy排序、搜尋和計數函式


NumPy - 排序、搜尋和計數函式

NumPy中提供了各種排序相關功能。 這些排序函式實現不同的排序演算法,每個排序演算法的特徵在於執行速度,最壞情況效能,所需的工作空間和演算法的穩定性。 下表顯示了三種排序演算法的比較。

種類 速度 最壞情況 工作空間 穩定性
'quicksort'(快速排序) 1 O(n^2) 0
'mergesort'(歸併排序) 2 O(n*log(n)) ~n/2
'heapsort'(堆排序) 3 O(n*log(n)) 0

numpy.sort()

sort()函式返回輸入陣列的排序副本。 它有以下引數:

numpy.sort(a, axis, kind, order)

其中:

序號 引數及描述
1. a 要排序的陣列
2. axis 沿著它排序陣列的軸,如果沒有陣列會被展開,沿著最後的軸排序
3. kind 預設為'quicksort'(快速排序)
4. order 如果陣列包含欄位,則是要排序的欄位

範例

import numpy as np  
a = np.array([[3,7],[9,1]])  
print  '我們的陣列是:'  
print a 
print  '\n'  
print  '呼叫 sort() 函式:'  
print np.sort(a)  
print  '\n'  
print  '沿軸 0 排序:'  
print np.sort(a, axis =  0)  
print  '\n'  
# 在 sort 函式中排序欄位 
dt = np.dtype([('name',  'S10'),('age',  int)]) 
a = np.array([("raju",21),("anil",25),("ravi",  17),  ("amar",27)], dtype = dt)  
print  '我們的陣列是:'  
print a 
print  '\n'  
print  '按 name 排序:'  
print np.sort(a, order =  'name')

輸出如下:

我們的陣列是:
[[3 7]
 [9 1]]

呼叫 sort() 函式:
[[3 7]
 [1 9]]

沿軸 0 排序:
[[3 1]
 [9 7]]

我們的陣列是:
[('raju', 21) ('anil', 25) ('ravi', 17) ('amar', 27)]

按 name 排序:
[('amar', 27) ('anil', 25) ('raju', 21) ('ravi', 17)]

numpy.argsort()

numpy.argsort()函式對輸入陣列沿給定軸執行間接排序,並使用指定排序型別返回資料的索引陣列。 這個索引陣列用於構造排序後的陣列。

範例

import numpy as np 
x = np.array([3,  1,  2])  
print  '我們的陣列是:'  
print x 
print  '\n'  
print  '對 x 呼叫 argsort() 函式:' 
y = np.argsort(x)  
print y 
print  '\n'  
print  '以排序後的順序重構原陣列:'  
print x[y]  
print  '\n'  
print  '使用迴圈重構原陣列:'  
for i in y:  
    print x[i],

輸出如下:

我們的陣列是:
[3 1 2]

對 x 呼叫 argsort() 函式:
[1 2 0]

以排序後的順序重構原陣列:
[1 2 3]

使用迴圈重構原陣列:
1 2 3

numpy.lexsort()

函式使用鍵序列執行間接排序。 鍵可以看作是電子試算表中的一列。 該函式返回一個索引陣列,使用它可以獲得排序資料。 注意,最後一個鍵恰好是 sort 的主鍵。

範例

import numpy as np 

nm =  ('raju','anil','ravi','amar') 
dv =  ('f.y.',  's.y.',  's.y.',  'f.y.') 
ind = np.lexsort((dv,nm))  
print  '呼叫 lexsort() 函式:'  
print ind 
print  '\n'  
print  '使用這個索引來獲取排序後的資料:'  
print  [nm[i]  +  ", "  + dv[i]  for i in ind]

輸出如下:

呼叫 lexsort() 函式:
[3 1 0 2]

使用這個索引來獲取排序後的資料:
['amar, f.y.', 'anil, s.y.', 'raju, f.y.', 'ravi, s.y.']

NumPy 模組有一些用於在陣列內搜尋的函式。 提供了用於找到最大值,最小值以及滿足給定條件的元素的函式。

numpy.argmax()numpy.argmin()

這兩個函式分別沿給定軸返回最大和最小元素的索引。

範例

import numpy as np 
a = np.array([[30,40,70],[80,20,10],[50,90,60]])  
print  '我們的陣列是:'  
print a 
print  '\n'  
print  '呼叫 argmax() 函式:'  
print np.argmax(a)  
print  '\n'  
print  '展開陣列:'  
print a.flatten()  
print  '\n'  
print  '沿軸 0 的最大值索引:' 
maxindex = np.argmax(a, axis =  0)  
print maxindex 
print  '\n'  
print  '沿軸 1 的最大值索引:' 
maxindex = np.argmax(a, axis =  1)  
print maxindex 
print  '\n'  
print  '呼叫 argmin() 函式:' 
minindex = np.argmin(a)  
print minindex 
print  '\n'  
print  '展開陣列中的最小值:'  
print a.flatten()[minindex]  
print  '\n'  
print  '沿軸 0 的最小值索引:' 
minindex = np.argmin(a, axis =  0)  
print minindex 
print  '\n'  
print  '沿軸 1 的最小值索引:' 
minindex = np.argmin(a, axis =  1)  
print minindex

輸出如下:

我們的陣列是:
[[30 40 70]
 [80 20 10]
 [50 90 60]]

呼叫 argmax() 函式:
7

展開陣列:
[30 40 70 80 20 10 50 90 60]

沿軸 0 的最大值索引:
[1 2 0]

沿軸 1 的最大值索引:
[2 0 1]

呼叫 argmin() 函式:
5

展開陣列中的最小值:
10

沿軸 0 的最小值索引:
[0 1 1]

沿軸 1 的最小值索引:
[0 2 0]

numpy.nonzero()

numpy.nonzero()函式返回輸入陣列中非零元素的索引。

範例

import numpy as np 
a = np.array([[30,40,0],[0,20,10],[50,0,60]])  
print  '我們的陣列是:'  
print a 
print  '\n'  
print  '呼叫 nonzero() 函式:'  
print np.nonzero (a)

輸出如下:

我們的陣列是:
[[30 40 0]
 [ 0 20 10]
 [50 0 60]]

呼叫 nonzero() 函式:
(array([0, 0, 1, 1, 2, 2]), array([0, 1, 1, 2, 0, 2]))

numpy.where()

where()函式返回輸入陣列中滿足給定條件的元素的索引。

範例

import numpy as np 
x = np.arange(9.).reshape(3,  3)  
print  '我們的陣列是:'  
print x 
print  '大於 3 的元素的索引:' 
y = np.where(x >  3)  
print y 
print  '使用這些索引來獲取滿足條件的元素:'  
print x[y]

輸出如下:

我們的陣列是:
[[ 0. 1. 2.]
 [ 3. 4. 5.]
 [ 6. 7. 8.]]

大於 3 的元素的索引:
(array([1, 1, 2, 2, 2]), array([1, 2, 0, 1, 2]))

使用這些索引來獲取滿足條件的元素:
[ 4. 5. 6. 7. 8.]

numpy.extract()

extract()函式返回滿足任何條件的元素。

import numpy as np 
x = np.arange(9.).reshape(3,  3)  
print  '我們的陣列是:'  
print x 
# 定義條件 
condition = np.mod(x,2)  ==  0  
print  '按元素的條件值:'  
print condition 
print  '使用條件提取元素:'  
print np.extract(condition, x)

輸出如下:

我們的陣列是:
[[ 0. 1. 2.]
 [ 3. 4. 5.]
 [ 6. 7. 8.]]

按元素的條件值:
[[ True False True]
 [False True False]
 [ True False True]]

使用條件提取元素:
[ 0. 2. 4. 6. 8.]