ClouderaApacheHadoop培訓(xùn)及認(rèn)證幫助您進(jìn)階大數(shù)據(jù)知識及技能。
Cloudera大學(xué)為期4天的Hadoop管理員培訓(xùn)將幫助學(xué)員綜合理解并全面掌握通過ClouderaManager對Hadoop集群的運(yùn)維管理,包括:安裝,配置、負(fù)載平衡及性能調(diào)優(yōu)等。通過該培訓(xùn),Hadoop系統(tǒng)管理員將能準(zhǔn)備好應(yīng)對實(shí)際運(yùn)維中遇到的挑戰(zhàn)。 一.培訓(xùn)內(nèi)容 通過講師在課堂上的講解,以及實(shí)操練習(xí),學(xué)員將學(xué)習(xí)以下內(nèi)容: ● ClouderaManager管理集群的特性,諸如日志匯總、配置管理、資源管理、報(bào)告、報(bào)警及服務(wù)管理等。 ● YARN、MapReduce、Spark及HDFS的工作原理。 ● 如何為你的集群選取合適的硬件和架構(gòu)。 ● 如何將Hadoop集群和企業(yè)已有的系統(tǒng)進(jìn)行無縫集成。 ● 如何使用Flume進(jìn)行實(shí)時(shí)數(shù)據(jù)采集以及如何使用Sqoop在RDBMS和Hadoop集群之間進(jìn)行數(shù)據(jù)導(dǎo)入導(dǎo)出。 ● 如何配置公平調(diào)度器為Hadoop上的多用戶提供服務(wù)級別保障。 ● 產(chǎn)品環(huán)境中Hadoop集群的運(yùn)維實(shí)踐。 ● Hadoop集群排錯(cuò)、診斷問題和性能調(diào)優(yōu)。 二.培訓(xùn)對象及學(xué)員基礎(chǔ) 面向系統(tǒng)管理員和IT經(jīng)理,需具備Linux經(jīng)驗(yàn),無需ApacheHadoop基礎(chǔ)。 三.認(rèn)證 結(jié)束本課程培訓(xùn)后,我們建議學(xué)員準(zhǔn)備并注冊參加CCAHadoop管理員考試。通過并獲取該證書是向公司及客戶證明個(gè)人在Hadoop領(lǐng)域的技術(shù)和專長的有力依據(jù)。 四.課程大綱 1. ApacheHadoop介紹 ● Hadoop的創(chuàng)建動(dòng)機(jī) ● 基本概念 ● Hadoop核心部件 2. Hadoop集群安裝 ● 集群管理方案 ● ClouderaManager特性 ● Clouderamanager安裝 ● Hadoop(CDH)安裝 3. Hadoop分布式文件系統(tǒng)(HDFS) ● HDFS特性 ● 讀寫文件 ● NameNode內(nèi)存考慮 ● HDFS安全簡介 ● HDFSWebUI ● 使用HDFSShell 4. YARN上的MapReduce和Spark ● 計(jì)算平臺在Hadoop里扮演的角色 ● YARN:集群資源管理器 ● MapReduce概念 ● ApacheSpark概念 ● Yarn上的計(jì)算平臺 ● 通過WebUI及Shell觀察YARN應(yīng)用 ● YARN應(yīng)用運(yùn)行日志 5. Hadoop配置及服務(wù)運(yùn)行日志 ● ClouderaManager配置管理機(jī)制 ● 定位配置參數(shù)及進(jìn)行配置變更 ● 管理角色實(shí)例及添加服務(wù) ● 配置HDFS服務(wù) ● 配置Hadoop服務(wù)運(yùn)行日志 ● 配置YARN服務(wù) 6. HDFS數(shù)據(jù)導(dǎo)入 ● 使用Flume從外部數(shù)據(jù)源實(shí)時(shí) ● 導(dǎo)入數(shù)據(jù) ● 使用Sqoop從關(guān)系數(shù)據(jù)庫導(dǎo)入數(shù)據(jù) ● REST接口 ● 導(dǎo)入數(shù)據(jù)的實(shí)踐 7. Hadoop集群規(guī)劃 ● 規(guī)劃考慮因素 ● 硬件選擇 ● 虛擬化選項(xiàng)* ● 網(wǎng)絡(luò)因素 ● 節(jié)點(diǎn)配置 8. Hive,Impala及Pig安裝及配置 ● Hive ● Impala ● Pig 9. Hadoop客戶端及Hue ● 什么是Hadoop客戶端 ● 安裝及配置Hadoop客戶端 ● 安裝及配置Hue ● 使用Hue進(jìn)行身份驗(yàn)證及授權(quán) 10. 集群高級配置 ● 高級配置參數(shù) ● Hadoop端口配置 ● HDFS機(jī)柜感知配置 ● HDFS高可靠性配置 11. Hadoop安全 ● Hadoop安全的重要性 ● Hadoop安全性概念 ● Kerberos簡介 ● 使用Kerberos保護(hù)Hadoop集群 ● 其他安全概念 12. 資源管理 ● 使用靜態(tài)服務(wù)池配置Linuxcgroup ● 公平調(diào)度器 ● 配置動(dòng)態(tài)資源池 ● YARN內(nèi)存及CPU設(shè)置 ● Impala查詢調(diào)度 13. 集群維護(hù) ● 檢查HDFS狀態(tài) ● 集群間復(fù)制數(shù)據(jù) ● 添加/移除集群節(jié)點(diǎn) ● 集群數(shù)據(jù)負(fù)載平衡 ● 目錄快照 ● 集群升級 14. 集群監(jiān)控及排錯(cuò) ● ClouderaManager監(jiān)控特性 ● 監(jiān)控Hadoop集群 ● Hadoop集群排錯(cuò) ● 常見配置不當(dāng)問題 15. 結(jié)論
Cloudera大數(shù)據(jù)課程體系