logo
Loading...

Day2 - 2小時就上手!用 Pyecharts 做出可互動的酷炫圖表 - Cupoy

程式碼下載 Day 2 範例與作業 請點我下載 Outline 談談各種圖表 折線圖、散佈圖(實作) 圓餅圖、雷達圖(實作) 談談各種圖表 比較類型 比較圖表用於對值進行相互比較。這顯示值的...

程式碼下載 Day 2 範例與作業 請點我下載 Outline 談談各種圖表 折線圖、散佈圖(實作) 圓餅圖、雷達圖(實作) 談談各種圖表 比較類型 比較圖表用於對值進行相互比較。這顯示值的差異,例如類別之間的差異或值隨著時間變更的方式。 直條圖 針對一個或多個相同的量值比較類別。 直條圖適合用於比較多個值。維度軸可顯示比較的類別項目,而量值軸可顯示每個類別項目的值。 Ref:Qlik 優點: 直條圖的優點是易於閱讀和理解。 缺點: 由於軸長度的限制,直條圖不能很好地展示很多的維度值。如果維度不適合軸長度,您可以使用捲軸進行捲動,但此時您可能無法看到全部內容。 服用時機: 分組和堆疊長條可以更方便地展示已分組資料。 如要並排比較多個值,例如不同年份的銷售額與預測值進行比較時, 以及使用相同的單位計算量值時 (在此情況下為銷售額和預測值),條形圖同樣也非常有用。 折線圖 可以快速掌握隨著時間變化的趨勢。  折線圖用於顯示隨時間變化的趨勢。維度通常位於 X 軸,量值通常位於 Y 軸。 Ref:Qlik 優點: 折線圖易於理解,並便於觀眾即時瞭解發展趨勢。 缺點:  在一個折線圖中使用多個線條時,會使折線圖雜亂交錯,難以解讀。因此,應避免使用兩個或三個以上的量值。 服用時機: 折線圖主要適用於您想顯示隨時間發展的趨勢和移動的情況,在這種情況下,維度值 (例如月、季或財務年度) 會均勻分佈。 組合圖 比較刻度不同的量值。  組合圖適用於比較兩組通常因為刻度之間的差異而難以比較的量值。基本上是結合折線圖的直條圖。 Ref:Qlik 優點: 當要組合不同值範圍的幾個量值時,組合圖是最佳選擇。 缺點: 組合圖只支援一個維度,因此如果需要在視覺化中包含兩個或多個維度時,不能使用組合圖。 服用時機: 組合圖可以具有不同的量值刻度,一個在左,一個在右, 如果需要顯示因為值範圍的巨大差異而一般難以組合的量值時,組合圖是理想的選擇。 關係類型 關係圖表用來探索值相互關聯的方式。關係圖表可讓您找到相互關聯、異常值和資料叢集。 散佈圖 用以檢視二維或三維資料之間的關係。 散佈圖會呈現兩個或三個量值的成對數值。 Ref:Qlik 優點: 散佈圖是同時顯示兩個或更多量值之間關係的好方法。第三個量值是區分各值以及簡化大型國家地區、大客戶、大數量等的識別的有效方法。 缺點: 由於散佈圖的兩個軸上均分佈有量值,並且第三個選用量值也給理解增加了複雜性,因此沒有經驗的使用者可能很難理解散佈圖。確保初學者能夠正確理解散佈圖。其中一個好方法是使用說明標籤,以便視覺化更容易理解;各值可能會在彼此頂端重疊,不放大時難以看清。 服用時機: 散佈圖會幫助您找到各值之間的潛在關係,並找出資料集中的離群值。 如果想讓顯示的資料中每個執行個體均有至少兩個指標, 例如不同國家或地區的人均壽命和人均國內生產總值,散佈圖便非常實用。 組成類型 組成圖表可取得總值並探索哪些元件值建立了該項總值。組成圖表可以是靜態,顯示目前的總值組成,或者可以顯示總值的組成如何隨著時間變更。組成圖表可以透過總值的百分比或總值中的固定值顯示元件。 橫條圖 檢視值的組成的短期變化情形。 橫條圖適合用於比較多個值。維度軸可顯示比較的類別項目,而量值軸可顯示每個類別項目的值。 Ref:Qlik 優點: 橫條圖的優點是易於閱讀和理解。 缺點: 由於軸長度的限制,橫條圖不能很好地展示很多的維度值。如果維度不適合軸長度,您可以使用捲軸進行捲動,但此時您可能無法看到全部內容。 服用時機: 分組和堆疊長條可以更方便地展示已分組資料。 如要並排比較多個值,例如不同年份的銷售額與預測值進行比較時,以及使用相同的單位計算量值時 (在此情況下為銷售額和預測值),條形圖同樣也非常有用。 折線圖 檢視值的組成的長期變化情形。 折線圖用於顯示隨時間變化的趨勢。維度通常位於 X 軸,量值通常位於 Y 軸。 Ref:Qlik 優點: 折線圖易於理解,並便於觀眾即時瞭解發展趨勢。 缺點: 在一個折線圖中使用多個線條時,會使折線圖雜亂交錯,難以解讀。因此,應避免使用兩個或三個以上的量值。 服用時機: 折線圖主要適用於您想顯示隨時間發展的趨勢和移動的情況, 在這種情況下,維度值 (例如月、季或財務年度) 會均勻分佈。 圓餅圖 檢視值的靜態組成。 在圓餅圖中,維度會形成量值的各個扇區。圓餅圖有一個維度並最多具有兩個量值。 Ref:Qlik 優點: 當使用幾個扇區作為維度時,圓形圖有利於即時瞭解所佔比例。使用 10 個或更少的扇區時,圓餅圖可保證其視覺效率。 缺點: 可能難以比較一個圓餅圖內的不同扇區,特別是圖中帶有多個扇區時。 圓餅圖中所顯示的值會佔據大量空間。 服用時機: 圓餅圖的主要用於比較特定扇區與總計。 當只有兩個扇區時,例如是/否或已排入佇列/已完成,圓形圖特別有用。 不建議您互相比較兩個圓形圖的結果。 瀑布圖 透過累積或減去總計以檢視值的靜態組成。 瀑布圖適合用來說明中間正值和負值如何影響初始值。開始值和最終值以整個長條表示,中間值則以浮動長條表示。您也可以在圖表中顯示小計。 Ref:Qlik 優點: 瀑布圖可讓人快速理解值的轉換。 缺點: 瀑布圖與資料的詳細分析無關,因為您無法在圖表中進行選取或展開資料。 服用時機: 瀑布圖適合用來說明中間正值和負值如何影響初始值。 關於此的一個例子是損益表,用於您要顯示不同帳戶的正數分擔額和負數分擔額的情況。 樹狀圖 檢視值累積至總計的靜態組成。 樹狀圖使用巢狀矩形 (即較小矩形嵌套在較大矩形) 來顯示階層式資料。 Ref:Qlik 優點: 樹狀圖是一種非常經濟的方式,它可以在有限的空間內使用,同時仍可顯示大量的項目。 當樹狀結構中色彩和大小之間存在相關性時,您可以看到採用其他方式難以看到的模式,例如,當某種色彩具有特別相關性 缺點: 當量值的量級存在巨大差異時,樹狀圖不是一個好選擇。當混合絕對值和相對值時,樹狀圖也不是一個正確的選擇。 在樹狀圖中不能顯示負值。 服用時機: 在空間有限且您需要查看大量的層級式資料時使用樹狀圖。 樹狀圖應主要用於展示可以進行彙總的值。 分佈類型 分佈圖表用來探索資料中的值組成群組的方式。分佈圖表可向您顯示資料形狀、其值的範圍以及可能異常值。 直方圖 直方圖適合顯示持續間隔或特定期間當中數字資料的分佈。資料會分成幾個 bin,直方圖中的每個長條代表每個 bin 的表列頻率。 優點: 直方圖會組織大量資料,並使用單一維度快速產生視覺化。 缺點: 直方圖不適用於詳細的資料分析,因為它適合於處理資料分佈的摘要資訊。 服用時機: 直方圖適合顯示持續間隔或特定期間當中數字資料的分佈。 散佈圖 用以檢視二維或三維資料之間的關係。 散佈圖會呈現兩個或三個量值的成對數值。 Ref:Qlik 優點: 散佈圖是同時顯示兩個或更多量值之間關係的好方法。第三個量值是區分各值以及簡化大型國家/地區、大客戶、大數量等的識別的有效方法。 缺點: 由於散佈圖的兩個軸上均分佈有量值,並且第三個選用量值也給理解增加了複雜性,因此沒有經驗的使用者可能很難理解散佈圖。確保初學者能夠正確理解散佈圖。其中一個好方法是使用說明標籤,以便視覺化更容易理解;各值可能會在彼此頂端重疊,不放大時難以看清。 服用時機: 散佈圖會幫助您找到各值之間的潛在關係,並找出資料集中的離群值。 如果想讓顯示的資料中每個執行個體均有至少兩個指標,例如不同國家或地區的人均壽命和人均國內生產總值,散佈圖便非常實用。 分佈圖 檢視維度中量值的分佈。 分佈圖適用於比較數值資料組的範圍和分佈。資料沿著軸繪製為值點。 Ref:Qlik 優點: 分佈圖視覺化資料分佈。 缺點: 分佈圖不適用於詳細的資料分析,因為它適合於處理資料分佈的摘要資訊。 服用時機: 查看連續資料與中間的離群值適用。 盒狀圖 檢視數字資料的範圍和分佈。 盒狀圖適用於比較數值資料組的範圍和分佈,由帶鬚值的方塊以及中間的中心線說明。鬚值代表高參考值和低參考值,用於排除異常值。 優點: 盒狀圖可組織大量資料並顯示異常值。 缺點: 盒狀圖不適用於詳細的資料分析,因為它適合於處理資料分佈的摘要資訊。 服用時機: 盒狀圖適用於比較數值資料組的範圍和分佈。 績效類型 績效圖表可讓人快速檢視績效量值。查看績效圖表時,使用者可以快速識別量值,以及結果是否符合預期。 子彈圖 比較數個維度的量值績效。 子彈圖 (子彈圖) 以延伸選項顯示量測計。子彈圖可用來視覺化量值績效,並針對目標值和質性尺度進行比較,例如不良、平均和良好。 Ref:Qlik 優點: 子彈圖可讓您透過比普通量測計更豐富的資訊,比較並測量績效。 服用時機: 子彈圖可讓您透過比普通量測計更豐富的資訊,比較並測量績效。 根據目標和簡單績效評等比較績效時,這十分實用。 例如:您可以顯示銷售量與目標值的關係,以及在不良、良好和延展績效背景下進行。 量測計(儀表板) 檢視績效值,立即瞭解績效。 量測計顯示單一量值並顯示如何解譯該值。 Ref:Qlik 優點: 量表易於閱讀和理解,並可為某個區域內的業績提供即時指示。 缺點: 對於它所顯示的單一值,量表對空間的要求很高。 儘管量表具有極佳的顯示效果,但它不是展示單一量值的最佳選擇。如果在決定最大和最小值時出現問題,這表示您可能應使用其他視覺化。 如果您只想顯示績效值而不使用量測計的話,可以考慮使用 KPI。 服用時機: 量表通常用於展示 KPI (例如,在執行儀表板上),如果搭配使用分區段和色彩標記,量表則是說明績效結果的一個有效方法。 設定相關的最大和最小值以為值的解譯提供支援,這一點很重要。 您可以使用參考資料行以提供更多背景資訊。 KPI 檢視一個或兩個績效量值。 KPI 視覺化可以顯示一個或兩個量值,可用於追蹤性能。 Ref:Qlik 優點: KPI 可幫助快速瞭解區域內的績效情況。 缺點: 當涉及圖形元件時,KPI 在某些程度上會受到限制。您可以使用多個符號來幫助說明績效,但如要更醒目的元件,請考慮使用量測計。 服用時機: 使用 KPI 可大致瞭解一個組織最重要的績效值。 使用顏色標記和符號可表示數字與預期結果之間的關係。 地理空間類型 地理圖表可讓您依地理位置視覺化資料,將資料在地圖上顯示為點或區域。 地圖 檢視依點或區域以地理方式呈現的資料。 可透過地圖所在的泡泡或顏色顯示各地區差異。 Ref:Qlik Ref:Google新聞 優點: 地圖是多功能的視覺化,可高效展示與位置或區域相關的關鍵值的地理分佈。 缺點: 如果使用大量的值,可能會難以獲得良好的概覽視圖。各個值可能會彼此重疊,除非放大,否則難以看清。 服用時機: 您可以使用地圖來顯示辦事處、商店和其他商業相關場所的地理分佈。 您不但可以看到位置,還可以看到銷售額和其他量值,並可按泡泡大小或色彩顯示值差異。 視覺化前先分析你的數值類型 折線圖 畫個折線圖 Data:交通部中央氣象局 折線圖程式碼 折線圖程式碼 - 加入最高最低值 畫完折線圖 散佈圖 畫個散佈圖 補充 - 六標準差 常態分配,又稱高斯分配,由德國數學家Gauss提出,分配內絕大多數(99.7%)落於正負標三標準差內,一般來說常態分配全距為六標準差。 散佈圖程式碼 散佈圖程式碼 - 管制線 散佈圖程式碼 - 瑕疵數量 散佈圖程式碼 - 瑕疵數量優化 散佈圖程式碼 - 整合 完成散佈圖 圓餅圖 畫個圓餅圖 Data:全球手機市佔排名 圓餅圖程式碼 圓餅圖程式碼 - 優化 圓餅圖完成 水球圖 畫個水球圖 水球圖程式碼 水球圖完成 雷達圖 畫個雷達圖 Data:NBA中國官網季前賽數據 雷達圖程式碼 雷達圖程式碼 - 畫出數據 雷達圖程式碼 - 優化 雷達圖程式碼 - 單一數據顯示 雷達圖程式碼 - 變化換形狀 雷達圖完成 更多資料請參考文件:pyecharts Day2 課後練習 折線圖產生平均線 將直線圖與組合圖合併 改變水球圖形狀與顏色