Pandas教學


Pandas是一款開放原始碼的BSD許可的Python庫,為Python程式設計語言提供了高效能,易於使用的資料結構和資料分析工具。Pandas用於廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。在本教學中,我們將學習Python Pandas的各種功能以及如何在實踐中使用它們。

Python Pandas的官方網站是: http://pandas.pydata.org/ ,開啟後如下所示 -

Python Pandas教程

Pandas庫的介紹

Pandas是一個開放原始碼的Python庫,它使用強大的資料結構提供高效能的資料操作和分析工具。它的名字:Pandas是從Panel Data - 多維資料的計量經濟學(an Econometrics from Multidimensional data)。

2008年,為滿足需要高效能,靈活的資料分析工具,開發商Wes McKinney開始開發Pandas

Pandas之前,Python主要用於資料遷移和準備。它對資料分析的貢獻更小。 Pandas解決了這個問題。 使用Pandas可以完成資料處理和分析的五個典型步驟,而不管資料的來源 - 載入,準備,操作,模型和分析。

Python Pandas用於廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。

Pandas的主要特點

  • 快速高效的DataFrame物件,具有預設和自定義的索引。
  • 將資料從不同檔案格式載入到記憶體中的資料物件的工具。
  • 丟失資料的資料對齊和綜合處理。
  • 重組和擺動日期集。
  • 基於標籤的切片,索引和巨量資料集的子集。
  • 可以刪除或插入來自資料結構的列。
  • 按資料分組進行聚合和轉換。
  • 高效能合併和資料加入。
  • 時間序列功能。

讀者

本教學為準備學習Pandas基礎知識和各種功能的人員而做準備的。它對資料清理和分析的人員特別有用。 完成本教學之後,將發現自己處於適度的專業知識水平,可以從中獲得更高水平的專業知識。

先決條件

要求對計算機程式設計術語有一個基本的了解。 對任何程式設計語言的基本了解是一個加分。Pandas庫使用NumPy的大部分功能。建議在繼續本教學之前,先閱讀NumPy的教學( /3/34/1213.html )。