logo
Loading...

第二章 大數據框架 - Cupoy

大數據框架是一種結構化方法,由六個核心功能組成。 (1) 大數據戰略 ( BIG DATA STRATEGY ) 數據已成為大多數組織的戰略資產。分析大型數據集和識別數據模式的能力,可以為組織提供競爭優勢。例如,Netflix在決定製作哪些電影或系列影片時,會考慮用戶行為。中國採購平台 - 阿里巴巴,通過數據分析確定為哪些供應商貸款,並在其平台上推薦它們。成為全球巨頭之一。大數據已經成為了一種大的生意。 為了從大數據投資中獲得切實的成果,企業組織需要一個健全的大數據戰略。如何實現投資回報,以及將重點放在大數據分析和分析中的哪些方面?分析的可能性,在實際上是無窮無盡的,組織很容易迷失在浩瀚無盡的數據中。健全和結構化的大數據戰略是大數據成功的第一步。在第3章中,我們將探討大數據的業務驅動因素,並討論如何制定大數據戰略。 (2) 大數據架構 ( BIG DATA ARCHITECTURE ) 為了處理海量數據集,組織應具備儲存和處理大量數據的能力。為了實現這一目標,企業應該擁有資訊基礎架構來促進大數據的處理與分析。因此,企業應該擁有全面的大數據架構來促進大數據分析。企業應該如何設計和建立他們的架構以促進大數據分析呢?從儲存和處理 ( 電腦系統 ) 的角度來看,有哪些要求? 大數據框架的大數據架構元素考慮了大數據環境的技術能力。它討論了大數據架構中存在的各種角色,並著眼於設計的最佳實踐。根據框架獨立於供應商的結構,第4章將介紹與討論美國國家標準與技術研究院(National Institute of Standards and Technology , NIST)的大數據參考架構。 (3) 大數據演算法 ( BIG DATA ALGORITHMS ) 處理數據的基本能力是對統計和演算法有一個全面的瞭解。因此,大數據專業人員需要具備統計和演算法的扎實背景,以從數據中推斷出洞察力。演算法是如何解決一類問題的明確規範。演算法可以執行計算、數據處理和自動推理 ( calculations, data processing and automated reasoning ) 的任務。通過將演算法應用於大量數據,可以獲得有價值的知識和見解。 大數據框架的大數據演算法元素側重於渴望使用大數據的每個人的(技術)能力。它目的是要建立一個包括基本統計操作的堅實基礎,並介紹不同類別的演算法。 第5章簡要介紹了大數據演算法的主題。企業大數據分析師和企業大數據科學家手冊 ( 下一個階段的培訓與認證 ) 中討論了高級統計和機器學習技術。 (4)大數據流程 ( BIG DATA PROCESSES ) 為了使大數據在企業組織中取得成功,有必要考慮的不僅僅是技能和技術。流程可以幫助企業集中精力。流程帶來了結構、可衡量的步驟,並且可以在日常的基礎上進行有效管理。此外,流程通過遵循類似的程序和步驟將大數據專業知識嵌入組織中,將其作為組織的 “實踐” 嵌入。分析這件工作就會降低對個人的依賴性,從而大大提高了長期獲取價值的機會。 第6章概述了適用於每個組織的三個基本大數據流程。它討論了每個流程的效益,並逐步描述了將大數據實踐嵌入組織的流程活動。 (5)大數據職能 ( BIG DATA FUNCTIONS ) 大數據職能涉及管理企業中大數據組織的各個方面。大數據職能的這一要素闡述了組織如何建構自己以建立大數據角色 ( roles ),並討論大數據在組織中的角色和職責。組織文化、組織結構和工作角色對大數據計劃的成功,將會產生重大的影響。因此,我們將利用一些 “最佳實踐” 在設置企業大數據計劃時採用。 在大數據職能章節中,我們討論了大數據的非技術方面。第7章討論了建立大數據卓越中心(Big Data Center of Excellence , BDCoE)的實際方面,並提供了有關BDCoE建立的詳細指導。此外,它還解決了在組織中啟動大數據專案的關鍵成功因素。 (6)人工智慧 ( ARTIFICIAL INTELLIGENCE ) 大數據框架的最後一個元素是人工智慧(AI)。人工智慧是當今世界感興趣的主要領域之一,它提供了一個充滿潛力的世界。在框架的這一部分,我們討論了大數據和人工智慧之間的關係,並概述了人工智慧的關鍵特徵。 大數據框架已被設置為每個人或組織的開放標準,該框架進一步建立在現有理論的基礎上,並總結了大數據中的主要主題和整體的流動。框架的六個要素中,會有一個邏輯順序。序列從框架的中間開始,順時針跟隨框架的六個元素,儘管排序很直接,但重要的是要理解,只有當框架的所有元素都能正常運行,才能實現人工智慧。           大數據成熟度的五點CMM級別: (1) 解析障礙(混亂和臨時活動) -         整個企業當中有極少的分析活動和相關的基礎架構,數據與分析策略都很模糊。 (2) 本地化分析(初始活動) -         整個企業的分析,僅是在孤島中 ( 獨立式的 ) 運作,或是對於數據與分析,都沒有總(體策略。 (3) 分析型作業(可重複活動) -         經過公司高層的支持和承諾,將孤立的功能分析擴展到共享的操作級分析。 (4) 分析型企業(存在於管理的活動) -         數據和分析被視為一種企業優先。該組織正在跨越所有領域開發企業範圍的分析功能,以創建有意義的內容             和想法。 (5) 數據驅動的企業(被優化的活動) -         由具有支持戰略決策的分析,創建具有可信賴洞察力的企業。企業正在收穫利益,並專注於優化分析。

大數據框架是一種結構化方法,由六個核心功能組成。 (1) 大數據戰略 ( BIG DATA STRATEGY ) 數據已成為大多數組織的戰略資產。分析大型數據集和識別數據模式的能力,可以為組織提供競爭優勢。例如,Netflix在決定製作哪些電影或系列影片時,會考慮用戶行為。中國採購平台 - 阿里巴巴,通過數據分析確定為哪些供應商貸款,並在其平台上推薦它們。成為全球巨頭之一。大數據已經成為了一種大的生意。 為了從大數據投資中獲得切實的成果,企業組織需要一個健全的大數據戰略。如何實現投資回報,以及將重點放在大數據分析和分析中的哪些方面?分析的可能性,在實際上是無窮無盡的,組織很容易迷失在浩瀚無盡的數據中。健全和結構化的大數據戰略是大數據成功的第一步。在第3章中,我們將探討大數據的業務驅動因素,並討論如何制定大數據戰略。 (2) 大數據架構 ( BIG DATA ARCHITECTURE ) 為了處理海量數據集,組織應具備儲存和處理大量數據的能力。為了實現這一目標,企業應該擁有資訊基礎架構來促進大數據的處理與分析。因此,企業應該擁有全面的大數據架構來促進大數據分析。企業應該如何設計和建立他們的架構以促進大數據分析呢?從儲存和處理 ( 電腦系統 ) 的角度來看,有哪些要求? 大數據框架的大數據架構元素考慮了大數據環境的技術能力。它討論了大數據架構中存在的各種角色,並著眼於設計的最佳實踐。根據框架獨立於供應商的結構,第4章將介紹與討論美國國家標準與技術研究院(National Institute of Standards and Technology , NIST)的大數據參考架構。 (3) 大數據演算法 ( BIG DATA ALGORITHMS ) 處理數據的基本能力是對統計和演算法有一個全面的瞭解。因此,大數據專業人員需要具備統計和演算法的扎實背景,以從數據中推斷出洞察力。演算法是如何解決一類問題的明確規範。演算法可以執行計算、數據處理和自動推理 ( calculations, data processing and automated reasoning ) 的任務。通過將演算法應用於大量數據,可以獲得有價值的知識和見解。 大數據框架的大數據演算法元素側重於渴望使用大數據的每個人的(技術)能力。它目的是要建立一個包括基本統計操作的堅實基礎,並介紹不同類別的演算法。 第5章簡要介紹了大數據演算法的主題。企業大數據分析師和企業大數據科學家手冊 ( 下一個階段的培訓與認證 ) 中討論了高級統計和機器學習技術。 (4)大數據流程 ( BIG DATA PROCESSES ) 為了使大數據在企業組織中取得成功,有必要考慮的不僅僅是技能和技術。流程可以幫助企業集中精力。流程帶來了結構、可衡量的步驟,並且可以在日常的基礎上進行有效管理。此外,流程通過遵循類似的程序和步驟將大數據專業知識嵌入組織中,將其作為組織的 “實踐” 嵌入。分析這件工作就會降低對個人的依賴性,從而大大提高了長期獲取價值的機會。 第6章概述了適用於每個組織的三個基本大數據流程。它討論了每個流程的效益,並逐步描述了將大數據實踐嵌入組織的流程活動。 (5)大數據職能 ( BIG DATA FUNCTIONS ) 大數據職能涉及管理企業中大數據組織的各個方面。大數據職能的這一要素闡述了組織如何建構自己以建立大數據角色 ( roles ),並討論大數據在組織中的角色和職責。組織文化、組織結構和工作角色對大數據計劃的成功,將會產生重大的影響。因此,我們將利用一些 “最佳實踐” 在設置企業大數據計劃時採用。 在大數據職能章節中,我們討論了大數據的非技術方面。第7章討論了建立大數據卓越中心(Big Data Center of Excellence , BDCoE)的實際方面,並提供了有關BDCoE建立的詳細指導。此外,它還解決了在組織中啟動大數據專案的關鍵成功因素。 (6)人工智慧 ( ARTIFICIAL INTELLIGENCE ) 大數據框架的最後一個元素是人工智慧(AI)。人工智慧是當今世界感興趣的主要領域之一,它提供了一個充滿潛力的世界。在框架的這一部分,我們討論了大數據和人工智慧之間的關係,並概述了人工智慧的關鍵特徵。 大數據框架已被設置為每個人或組織的開放標準,該框架進一步建立在現有理論的基礎上,並總結了大數據中的主要主題和整體的流動。框架的六個要素中,會有一個邏輯順序。序列從框架的中間開始,順時針跟隨框架的六個元素,儘管排序很直接,但重要的是要理解,只有當框架的所有元素都能正常運行,才能實現人工智慧。           大數據成熟度的五點CMM級別: (1) 解析障礙(混亂和臨時活動) -         整個企業當中有極少的分析活動和相關的基礎架構,數據與分析策略都很模糊。 (2) 本地化分析(初始活動) -         整個企業的分析,僅是在孤島中 ( 獨立式的 ) 運作,或是對於數據與分析,都沒有總(體策略。 (3) 分析型作業(可重複活動) -         經過公司高層的支持和承諾,將孤立的功能分析擴展到共享的操作級分析。 (4) 分析型企業(存在於管理的活動) -         數據和分析被視為一種企業優先。該組織正在跨越所有領域開發企業範圍的分析功能,以創建有意義的內容             和想法。 (5) 數據驅動的企業(被優化的活動) -         由具有支持戰略決策的分析,創建具有可信賴洞察力的企業。企業正在收穫利益,並專注於優化分析。