Pandas面板(Panel)


面板(Panel)是3D容器的資料。面板資料一詞來源於計量經濟學,部分源於名稱:Pandas - pan(el)-da(ta)-s

3軸(axis)這個名稱旨在給出描述涉及面板資料的操作的一些語意。它們是 -

  • items - axis 0,每個專案對應於內部包含的資料影格(DataFrame)。
  • major_axis - axis 1,它是每個資料影格(DataFrame)的索引(行)。
  • minor_axis - axis 2,它是每個資料影格(DataFrame)的列。

1. pandas.Panel()

可以使用以下建構函式建立面板 -

pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)

建構函式的引數如下 -

引數 描述
data 資料採取各種形式,如:ndarrayseriesmaplistsdictconstant和另一個資料影格(DataFrame)
items axis=0
major_axis axis=1
minor_axis axis=2
dtype 每列的資料型別
copy 複製資料,預設 - false

2. 建立面板

可以使用多種方式建立面板 -

  • 從ndarrays建立
  • 從DataFrames的dict建立

2.1 從3D ndarray建立

# creating an empty panel
import pandas as pd
import numpy as np

data = np.random.rand(2,4,5)
p = pd.Panel(data)
print p

執行上面範例程式碼,得到以下結果 -

<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4

注意 - 觀察空面板和上面板的尺寸大小,所有物件都不同。

2.2 從DataFrame物件的dict建立面板

#creating an empty panel
import pandas as pd
import numpy as np

data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
        'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p

執行上面範例程式碼,得到以下結果 -

<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4

2.3 建立一個空面板

可以使用Panel的建構函式建立一個空面板,如下所示:

#creating an empty panel
import pandas as pd
p = pd.Panel()
print p

執行上面範例程式碼,得到以下結果 -

<class 'pandas.core.panel.Panel'>
Dimensions: 0 (items) x 0 (major_axis) x 0 (minor_axis)
Items axis: None
Major_axis axis: None
Minor_axis axis: None

3. 從面板中選擇資料

要從面板中選擇資料,可以使用以下方式 -

  • Items
  • Major_axis
  • Minor_axis

使用Items

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
        'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p['Item1']

執行上面範例程式碼,得到以下結果 -

            0          1          2
0    0.488224  -0.128637   0.930817
1    0.417497   0.896681   0.576657
2   -2.775266   0.571668   0.290082
3   -0.400538  -0.144234   1.110535

上面範例有兩個資料項,這裡只檢索item1。結果是具有4行和3列的資料影格(DataFrame),它們是Major_axisMinor_axis維。

使用major_axis

可以使用panel.major_axis(index)方法存取資料。參考以下範例程式碼 -

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
        'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.major_xs(1)

執行上面範例程式碼,得到以下結果 -

      Item1       Item2
0   0.417497    0.748412
1   0.896681   -0.557322
2   0.576657       NaN

使用minor_axis

可以使用panel.minor_axis(index)方法存取資料。參考以下範例程式碼 -

# creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
        'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p.minor_xs(1)

執行上面範例程式碼,得到以下結果 -

       Item1       Item2
0   -0.128637   -1.047032
1    0.896681   -0.557322
2    0.571668    0.431953
3   -0.144234    1.302466

注意 - 觀察尺寸大不的變化。