矩陣列印的規則
2019/09/03 下午 02:37
機器學習共學討論版
吳明宗
觀看數:58
回答數:2
收藏數:0
ml100-3
ml100-3-d06
app_train = pd.read_csv(f_app_train)
for col in app_train:
if app_train[col].dtype == 'object':....etc
想請問以上的code在讀取csv資料後
1.for迴圈中app_train[col]的col是指定循序讀取cloumn的意思嗎???
2.有循序讀取row的用法嗎
3.有相關文件可參考?
回答列表
-
2019/09/03 下午 03:05陳明佑 (Ming You Chen)贊同數:0不贊同數:0留言數:1
Ans1.
app_train 是 pandas 的 DataFrame
list(app_train) 是把這個 DataFrame 的 column_name當作一個集合
for col in app_train: 是依序從集合取出元素迴圈執行, 回圈內此元素稱之為 col
app_train[col] 是指 app_train 中, column_name 為 col 的這一行(資料型態為pandas.Series)
Ans2.
沒直接的做法 (所以row沒有.dtype可用), 但是你可以用 iloc 依序取出整行
for index in range(app_train.shape[0]):
print(app_train.iloc[index])
Ans3.
你如果是要處理資料(每個column一種型態), 就建議用 pandas 的 DataFrame
如果是要做"矩陣"運算(純數值矩陣), 建議用 Numpy 的 Array
搜尋這些名詞的官方說明就可以了
要注意兩者方法是不能混用的, 你要清楚想做的運算是什麼
-
2019/09/03 下午 11:04張維元 (WeiYuan)贊同數:1不贊同數:0留言數:0