logo
Loading...

list concat與unique() 和 nunique()問題 - Cupoy

Day9HW 問題:Q1Q1: 有與沒list()的差別:<圖一>特意轉成list type 的用處...

list concat與unique() 和 nunique()問題

2020/03/17 05:38 下午
機器學習共學討論版
Ava Chen
觀看數:22
回答數:3
收藏數:4

Day9HW 問題:Q1

Q1: 有與沒list()的差別:

<圖一>特意轉成list type 的用處是什麼?因為以<圖二>和<圖三>試驗結果,有沒有加是相同的(但type不同),還是只是寫程式的習慣不同呢?

<圖一>

<圖二>

<圖三>

===============================

Day12範例 問題:Q2

Q2: train_X中df_test的用意:

目前理解是df 中有house_train 和 house_test 的 data,如<圖一>,並在後續空值補、標準化都是針對train做如<圖二>,那麼df_test是有什麼其他的功用嗎?

<圖一>

<圖二>

===============================

Day15HW 問題:Q3 

Q3: unique() 和 nunique()的差別 :

<圖一>這裡試用nunique()取代unique() 來寫但不能work(Error如<圖二>),在 if app_train[col].nunique() <= 2 裡再算一次unique() 和 nunique() 但結果卻不同,求解QQ

<圖一>

<圖二>

===============================

Day16 HW問題:Q4, Q5

Q4: sorted() 和 np.sort()差別:

在排序年齡區間部分,請問作業做會選用np.sort()是因為速度比較快嗎?因為排出來的結果是一樣,只是type()不同,但都可work。

Q5:px = age_data['YEARS_BINNED']與age_groups.index.astype(str)畫圖產生的差別:

Q5-1:<圖二>黑色槓槓目前理解為誤差值,但換成<圖三>,px = age_groups.index.astype(str),為什麼就不會去顯示誤差值呢?

Q5-2:<圖二>(A)是用分組好的區間(age_data['YEARS_BINNED'])與其對應 age_data[TARGET] 做圖,<圖三>(B)是分好組平均完 age_data['Target'] (age_groups  = age_data.groupby('YEARS_BINNED').mean()這裡的問題是:為什麼<圖二>(A)出來也是平均值?



<圖一>

<圖二>

<圖三>