Spark 及 Hadoop開發員培訓將學習如何將數據導入到 Apache Hadoop 機群并使用 Spark、Hive、Flume、Sqoop、Impala 及其他 Hadoop 生態系統工具對數據進行各種操作和處理分析。Spark 及 Hadoop 開發員培訓將于2017-03-16召開,期間活動家將為您帶來更多的Spark 及 Hadoop 開發員培訓資訊和最安全的報名通道:
大數據問題和挑戰的能力。本課程包含了大量的實操及編程練習來幫助學員熟悉并掌握各種工具,并最終獲得在實際工作中針對特定的問題或場景來選取最佳解決工具或技術的能力。
培訓內容
通過講師在課堂上的講解,以及實操練習,學員將學習 Apache Spark 及如何將其集成到整個 Hadoop 生態系統中去,包括以下內容:
數據是如何在 Hadoop 機群里進行分布式存儲及處理的
如何使用 Sqoop 和 Flume 導入數據
如何使用 Apache Spark 處理分布式數據
如何使用 Impala 及 Hive 將結構化數據建模成表并進行分析查詢
如何根據數據使用場景來確定最佳存儲格式
數據存儲最佳實踐
培訓對象及學員基礎
本課程適合準備報考 CCA Spark 及 Hadoop 開發員認證考試的技術人員。雖然通過該認證考試,考生仍然需要做進一步的學習和準備,但是本課程涵蓋了在該認證考試中考核的很多主題和知識點。
在參加完本培訓后,我們建議學員參加此課程的一個后繼課程:“設計和創建大數據應用”
課程介紹
Hadoop 及生態系統介紹
傳統大規模系統的問題
Hadoop !
Hadoop 生態系統
Hadoop 體系結構及 HDFS
機群環境下的分布式處理
存儲:HDFS 體系結構
存儲:使用 HDFS
資源管理:YARN 體系結構
資源管理:使用 YARN
使用 Apache Sqoop 導入關系數據
Sqoop 簡介
數據的基本導入導出
減少傳輸的數據量
改善 Sqoop 性能
Sqoop 2
……
為了簡化報名流程,Spark 及 Hadoop 開發員培訓已開通網上購票系統,您可登陸活動家網站進行峰會報名!
快捷報名地址:https://www.huodongjia.com/event-661863863.html
相關閱讀:
Cloudera Apache Hadoop 管理員培訓(上海站) 2017-03-23
Cloudera Apache Hadoop 管理員培訓(北京站)2017-03-09
Spark 及 Hadoop 開發員培訓 2017-03-16 上海