更新時間:2020-09-11 來源:黑馬程序員 瀏覽量:
課程簡介
從零開始講解大數據業務及數據采集和遷移需求,以案例驅動的方式講解基于Sqoop構建高性能的分布式數據遷移和同步平臺。
課程亮點
1,知識體系完備,從小白到大神各階段讀者均能學有所獲。
2,生動形象,化繁為簡,講解通俗易懂。
3,結合工作實踐及分析應用,培養解決實際問題的能力。
4,每一塊知識點, 都有配套案例, 學習不再迷茫。
適用人群
1、對大數據感興趣的在校生及應屆畢業生。
2、對目前職業有進一步提升要求,希望從事大數據行業高薪工作的在職人員。
3、對大數據行業感興趣的相關人員。
課程內容
第一章:企業數據遷移需求及解決方案
1.企業級數據遷移及同步需求
2.Sqoop的設計思想
3.Sqoop與Hadoop的關系
4.Sqoop的分布式實現原理
5.Sqoop的企業級版本選型
6.Sqoop1的部署安裝及配置
第二章:Sqoop數據導入實戰開發
1.Sqoop導入開發參數詳解
2.數據導入分布式文件系統HDFS
3.數據導入數據倉庫Hive
4.基于復雜條件實現數據導入
5.基于訂單案例實現Increment增量同步數據
6.基于訂單案例實現lastModified增量同步導入數據
7.數據導入原理詳解
第三章:Sqoop數據導出實戰開發
1.Sqoop導出開發參數詳解
2.基于MySQL實現數據導出
3.基于案例實現updateonly增量同步導出
4.基于案例實現allowinsert增量同步導出
5.數據導出原理詳解
第四章:Sqoop企業級任務管理
1.企業級數據管理業務
2.Sqoop Job命令參數詳解
3.基于訂單案例實現Sqoop Job實戰開發
4.Sqoop Job 任務管理