%matplotlib inline
##將後續畫圖的結果直接顯現在網頁中
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd #
用 df 是標準的叫法 (雖然這名稱我們隨便取也可以), 意思是 Data Frame, 這是 pandas 兩大資料結構之一。我們可以把 Data Frame 想成一張表格 (雖然其實可以是很多張表格)。
我們來看看我們 df 的前五筆資料。
df = pd.read_csv("grades.csv") #這裡的df是 data-frame的意思,你也可以用其他名稱代替
df.head() #看前五筆資料
df.tail() #看後面幾筆
#??tail()
不只 CSV 檔, 很多資料檔案, 像 Excel 檔都很容易在 pandas
完成。使用法是這樣:
df2 = pd.read_excel('filename.xls', 'sheetname')
其中 sheetname 那裡要放工作表的名稱, 如果是中文的最好改成英文。
df["數學"] #列出某一行
df.數學.mean()
df.國文.mean()
df.數學.std()
df.describe() #基本統計量
df[["國文", "英文", "數學"]].sum(1)#選三科相加