模塊七:新一代大數(shù)據(jù)處理引擎Flink |
章 |
節(jié) |
練習(xí) |
學(xué)習(xí)目標(biāo)與案例 |
第3章:Flink的體系架構(gòu)與部署 |
- Flink簡介
- Flink的體系架構(gòu)
- Flink的安裝與部署
- Flink的分布式緩存
- 對(duì)比:Flink、Storm和Spark Streaming
|
安裝與部署Flink環(huán)境 |
掌握Flink的體系架構(gòu)與生態(tài)圈組件 |
第4章:Flink on Yarn的實(shí)現(xiàn) |
- 什么是Yarn?與Yarn的體系架構(gòu)
- 部署Yarn
- Flink on Yarn的兩種模式
- 內(nèi)存集中管理模式
- 內(nèi)存Job管理模式
- Flink on Yarn兩種模式的區(qū)別
|
部署Flink on Yarn |
理解并掌握Flink on Yarn的兩種模式的特點(diǎn) |
第5章:Flink HA的實(shí)現(xiàn) |
- 什么是HA?為什么需要HA?
- 大數(shù)據(jù)分布式協(xié)調(diào)框架ZooKeeper
- 什么是ZooKeeper
- 搭建ZooKeeper環(huán)境
- ZooKeeper的特性
- 實(shí)現(xiàn)分布式鎖
- 部署Flink HA高可用架構(gòu)環(huán)境
|
部署Flink HA環(huán)境 |
什么是HA?Flink HA的架構(gòu) |
第6章:Flink開發(fā)入門 |
- Flink批處理開發(fā)
- Java版本W(wǎng)ordCount
- Scala版本W(wǎng)ordCount
- Flink流處理開發(fā)
- Java版本W(wǎng)ordCount
- Scala版本W(wǎng)ordCount
- 使用Flink Scala Shell
- Flink的并行度分析
|
搭建Flink開發(fā)環(huán)境并開發(fā)應(yīng)用程序 |
掌握基本的Flink API編程 |
第7章:Flink DataSet API開發(fā) |
- Map、FlatMap與MapPartition
- Filter與Distinct
- Join操作
- 笛卡爾積
- First-N
- 外鏈接操作
|
基于DataSet API開發(fā)Flink離線計(jì)算應(yīng)用 |
掌握常用的Flink DataSet API算子的作用 |
第8章:Flink DataStreaming API開發(fā) |
- DataSources
- 基本的數(shù)據(jù)源示例
- 自定義數(shù)據(jù)源
- 內(nèi)置的Connector
- DataStream Transformation 轉(zhuǎn)換操作
- Data Sinks
- 集成Flink與Kafka
|
基于DataSet Stream開發(fā)Flink離線計(jì)算應(yīng)用 |
掌握常用的Flink DataStream API算子的作用 |
第9章:狀態(tài)管理和恢復(fù) |
- 狀態(tài):State
- Keyed State
- Operator State
- 檢查點(diǎn):Checkpoint
- 檢查點(diǎn)的配置:
- state backend存儲(chǔ)模式
- 修改State Backend的兩種方式
- 示例
- Restart Strategies(重啟策略)
|
開發(fā)應(yīng)用進(jìn)行Flink的有狀態(tài)計(jì)算 |
理解并掌握Flink的狀態(tài)管理機(jī)制 |
第10章:Window和Time |
- 窗口:Window
- Time Window示例
- Count Window示例
- Time:時(shí)間
- WaterMark:水位線
- Watermark的原理
- Watermark的三種使用情況
- 設(shè)置Watermark的核心代碼
- 窗口的allowedLateness
|
|
什么是Flink的窗口操作 |
第11章:Flink Table & SQL |
- Flink Table & SQL簡介
- 開發(fā)Flink Table & SQL程序
- 使用Flink SQL Client
|
使用Flink SQL分析處理數(shù)據(jù) |
掌握Flink的數(shù)據(jù)分析模塊 |
|
|
|
|
|