目录
01_01_什么是Flink
00:22:15
01_02_应用场景和前景
00:09:16
02_01_01_为什么选scala
00:10:26
02_01_02_scala 变量声明
00:15:06
02_01_03_scala Range和类型推断
00:12:12
02_01_04_scala循环
00:21:08
02_01_05_try catch
00:09:09
02_01_06_模式匹配
00:15:42
02_01_07_scala列表
00:17:52
02_01_08_scala映射表
00:10:30
02_01_09_scala高级操作
00:14:00
02_02_01_Flink安装讲解
00:25:32
02_02_02_Flink wordcount demo
00:24:17
02_02_03_打包运行
00:16:57
02_03_01_kafka安装讲解
00:25:05
02_03_02_kafka produce api讲解
00:22:11
02_03_03_kafka consumer api讲解
00:16:39
03_01_01_flink source之file
00:11:06
03_01_02_flink source之json
00:11:54
03_01_03_flink source之csv
00:13:17
03_01_04_flink source之mysql
00:18:40
03_02_01_flink transformation之Map、flatmap、reduce
00:29:40
03_02_02_flink transformation之Mapparttion、reduceGroup
00:18:49
03_02_03_flink transformation之filter
00:13:56
03_02_04_flink transformation之aggregate
00:13:15
03_02_05_flink transformation之join及优化
00:31:59
03_03_01_Flink Sink之Text
00:22:56
03_03_02_Flink Sink之CSV
00:17:49
03_03_03_Flink Sink之mysql
00:14:39
03_04_01_Flink iterate
00:07:28
03_04_02_Flink iterate案例讲解
00:07:41
03_04_03_Flink iterate
00:09:35
03_05_01_语义标注概念
00:08:30
03_05_02_语义标注案例
00:23:41
03_06_01_Flink 广播变量概念
00:10:54
03_06_02_Flink 广播变量实例
00:23:23
03_07_01_Flink 分布式缓存
00:23:17
03_08_01_Flink params传参
00:10:24
03_08_02_Flink GlobalCnfig传参
00:13:33
04_01_一个栗子
00:27:27
01_01_什么是Flink
00:22:15
01_02_应用场景和前景
00:09:16
02_01_01_为什么选scala
00:10:26
02_01_02_scala 变量声明
00:15:06
02_01_03_scala Range和类型推断
00:12:12
02_01_04_scala循环
00:21:08
02_01_05_try catch
00:09:09
02_01_06_模式匹配
00:15:42
02_01_07_scala列表
00:17:52
02_01_08_scala映射表
00:10:30
02_01_09_scala高级操作
00:14:00
02_02_01_Flink安装讲解
00:25:32
02_02_02_Flink wordcount demo
00:24:17
02_02_03_打包运行
00:16:57
02_03_01_kafka安装讲解
00:25:05
02_03_02_kafka produce api讲解
00:22:11
02_03_03_kafka consumer api讲解
00:16:39
03_01_01_flink source之file
00:11:06
03_01_02_flink source之json
00:11:54
03_01_03_flink source之csv
00:13:17
03_01_04_flink source之mysql
00:18:40
03_02_01_flink transformation之Map、flatmap、reduce
00:29:40
03_02_02_flink transformation之Mapparttion、reduceGroup
00:18:49
03_02_03_flink transformation之filter
00:13:56
03_02_04_flink transformation之aggregate
00:13:15
03_02_05_flink transformation之join及优化
00:31:59
03_03_01_Flink Sink之Text
00:22:56
03_03_02_Flink Sink之CSV
00:17:49
03_03_03_Flink Sink之mysql
00:14:39
03_04_01_Flink iterate
00:07:28
03_04_02_Flink iterate案例讲解
00:07:41
03_04_03_Flink iterate
00:09:35
03_05_01_语义标注概念
00:08:30
03_05_02_语义标注案例
00:23:41
03_06_01_Flink 广播变量概念
00:10:54
03_06_02_Flink 广播变量实例
00:23:23
03_07_01_Flink 分布式缓存
00:23:17
03_08_01_Flink params传参
00:10:24
03_08_02_Flink GlobalCnfig传参
00:13:33
04_01_一个栗子
00:27:27
04_02_流式计算概览
00:09:09
04_03_Flink Stream事件讲解
00:20:07
04_04_生成水印
00:21:48
04_05_scala代码讲解
00:15:57
04_06_punctuated watermark
00:31:50
04_07_waermark scala版本
00:12:42
05_01_状态和容错
00:14:40
05_02_状态含义理解
00:15:15
05_03_状态操作
00:19:36
05_04_scala状态操作
00:14:37
05_05_Operator State讲解
00:06:45
05_06_托管状态案例
00:22:02
05_07_broadcast State讲解
00:07:39
05_08_broadcast state代码编写
00:21:06
05_09_checkpoint概念讲解
00:12:13
05_10_启用checkpoint
00:11:31
05_11_state backends讲解
00:06:21
05_12_checkpoint代码讲解
00:10:20
05_13_chekpoint scala代码
00:02:09
05_14_checkpoint其他配置
00:04:28
05_15_queryable state讲解
00:09:28
05_16_queryable state代码演练
00:13:41
06_01_Flink windows概览
00:18:54
06_02_TumblingTimeWindows
00:24:21
06_03_TumblingProsessWindow scala讲解
00:08:27
06_04_TumblingEventwindow讲解
00:27:04
06_05_TumblingEventWindow scala
00:11:47
06_06_TumblingWindow指定偏移
00:06:16
06_07_Sliding windows讲解
00:11:25
06_08_SlidingProcessWindows Scala讲解
00:04:28
06_09_SlidingEventWindows讲解
00:17:35
06_10_session wiondows讲解
00:08:54
06_11_session windowjava讲解
00:23:35
06_12_SessionWindows Scala讲解
00:14:04
06_13_session processing window讲解
00:13:54
06_14_trigger讲解
00:20:34
06_15_Evictor讲解
00:09:22
06_16_allowedLateness讲解
00:26:48
06_18_window function讲解
00:09:53
06_19_ReduceFunction讲解
00:12:18
06_20_AggregateFunction讲解
00:25:06
06_21_foldFunction讲解
00:11:12
06_22_processwindowFunction讲解
00:18:14
06_23_processwindowFunction的高效聚合
00:21:32
06_24_processFunction
00:25:28
07_01_Operator函数简介
00:03:02
07_02_常用Operator函数讲解
00:26:32
07_03_window Operator讲解
00:11:20
07_04_Join Operator讲解
00:36:15
07_05_Join Operator代码讲解
00:25:44
07_06_CoGroup讲解
00:14:26
07_07_Connect讲解
00:10:51
07_08_window split讲解
00:16:20
07_09_iterator讲解
00:45:32
07_10_Flink分区讲解
00:03:38
07_10_project讲解
00:02:44
07_11_Custom partitioning讲解
00:17:12
07_12_Random Partition讲解
00:13:53
07_13_task chains讲解
00:23:18
07_14_Stream Source&Sink
00:17:18
07_15_Flink kafka讲解
00:49:14
07_16_kafka-connectorsscala讲解
00:20:07
07_17_flink-kafka容错
00:12:27
07_18_redis sink example
00:23:55
08_01_table&sql讲解
00:40:37
08_02_query in table&sql
00:08:25
08_03_stream和dataset注册成table
00:16:07
08_04_数据类型映射成表实战
00:24:26
08_05_table Streaming讲解
00:15:22
08_06_table 转为Stream
00:05:52
08_07_table时间属性
00:32:40
08_08_table event时间属性
00:12:34
08_09_查询配置
00:07:35
08_10_table api
00:07:12
08_11_Table API operator案例
00:10:39
08_12_table ApI operator实时处理
00:17:47
08_13_table window讲课
00:13:12
08_14_over window实战讲解
00:27:57
08_15_SQL API
00:25:51
08_16_SQL windowAPI讲解
00:26:27
08_17_SQL HOP&Session Window
00:18:40
08_18_kafkacsvtablesource讲解
00:32:54
08_19_csvtablesource讲解
00:12:36
08_20_自定义UDF介绍
00:08:45
08_21_自定义标量函数
00:20:50
08_22_自定义表函数讲解
00:18:48
08_23_自定义聚合函数讲解
00:28:28
08_24_新功能sqlclient讲解
00:28:49
08_25_Flink CEP概述
00:14:05
08_26_CEP基本案例介绍
00:30:10
08_27_CEP实战案例讲解
1:16:46
09_01_Flink实战-风控概述
00:20:26
09_02_Flink实战-Flink环境代码编写
00:33:52
09_03_Flink实战-时间属性设置
00:17:45
09_04_Flink实战-checkpoint代码编写
00:19:07
09_05_Flink实战-kafka数据源代码编写
00:33:06
09_06_Flink实战-watermark代码编写
00:22:51
09_07_Flink实战-用户IP访问限制
00:20:03
09_08_Flink实战-用户登录盗号嫌疑分析
00:15:19
09_09_Flink实战-黑名单的输出
00:29:02
09_10_Flink实战-去重算法讲解
00:43:50
09_11_Flink实战-redisSink
00:14:56
09_12_Flink实战-各城市访问人数
00:47:43
09_13_Flink实战-项目总结
00:10:49
大数据开发之Flink从入门到精通
公众号
小程序
这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、Storm,以及后来的 Spark,他们都有着各自专注的应用场景。Spark 掀开了内存计算的先河,也以内存为赌注,赢得了内存计算的飞速发展。Spark 的火热或多或少的掩盖了其他分布式计算的系统身影。就像 Flink,也就在这个时候默默的发展着。
Flink 是一个针对流数据和批数据的分布式处理引擎。它主要是由 Java 代码实现。目前主要还是依靠开源社区的贡献而发展。对 Flink 而言,其所要处理的主要场景就是流数据,批数据只是流数据的一个极限特例而已。再换句话说,Flink 会把所有任务当成流来处理,这也是其最大的特点。
这流处理和批处理统一的背景下,录制了这门课程。
1.课程研发环境
开发工具:IDEA;
数据库工具:redis 2.9.0 mysql 5.7
其他工具:kafka 0.10
2.内容简介
Flink核心是一个流式的数据流执行引擎,其针对数据流的分布式计算提供了数据分布、数据通信以及容错机制等功能。基于流执行引擎,Flink提供了诸多更高抽象层的API以便用户编写分布式任务:
DataSet API, 对静态数据进行批处理操作,将静态数据抽象成分布式的数据集,用户可以方便地使用Flink提供的各种操作符对分布式数据集进行处理,支持Java。
DataStream API,对数据流进行流处理操作,将流式的数据抽象成分布式的数据流,用户可以方便地对分布式数据流进行各种操作,支持Java和Scala。
Table API,对结构化数据进行查询操作,将结构化数据抽象成关系表,并通过类SQL的DSL对关系表进行各种查询操作,支持Java和Scala。
CEP API,对复杂时间处理,提供了自己的处理方式。
最后以风控项目结尾,更加切合实际的巩固知识。
JOJO老师:
多年任职一线互联网企业大数据开发,丰富的生产项目经验,专注于离线和实时数据处理,精通spark、kafka、flink等处理框架。
第一、基础技能储备
1.Scala基础讲解
2.Flink安装介绍
第二、Flink DataSet讲解
1.DataSet转换算子
2.DataSet数据源
3.DataSet数据接收
4.DataSet数据迭代
5.DataSet语义标注
6.DataSet广播变量
7.DataSet分布式缓存
第三、Flink Dstream讲解
1.Windows分配器(Tumbling Sliding Session Global)
2.Window 函数数据来源统计分析
3.触发器
4.延迟策略和水印
第四、Flink SQL讲解
1.Flink SQL基本概念
2.流式SQL处理
3.Table Api & SQL
4.表的输入源和输出
5.自定义UDF
6.Flink SQL客户端
第五、Flink 打包运行
1.Flink执行配置
2.Flink程序执行计划
3.Flink重启策略
第六、Flink CEP
1.概念介绍
2.模式API
3.检测模式
4.事件迟到处理
第七、实时风控项目
1.项目背景需求介绍
2.基于规则的实时交易次数统计
3.基于规则的实时交易频数统计
4.基于规则的交易风险统计
5.10亿数量级交易去重算法讲解
6.交易规则库的添加
7.风控黑名单单入库(mysql/redis展示)
8.基于规则的实时登陆地点限制
目标一. 了解Flink的环境配置
目标二. 了解Flink相关调优和原理
目标三. 掌握Flink相关java、scala代码编写
目标四. 掌握Flink相关复杂事件处理
目标五. 风控知识相关学习
亮点一、实战驱动、全程代码编写
亮点二、原理、调优讲解
1.课程针对人群
本课程针对具有一定的java、scala基础(不要求懂scala)与相关大数据框架经验,想通过本项目的学习,了解使用Flink相关原理和代码编写的相关开发人员。
2.我该怎么学,如何才能学好这门课程,给些建议。
2.1、时间上的安排建议
本课程共65讲,如果您时间上充分,建议以每天4-5讲的进度往前学习。
2.2、学习要求
如果您没有基础,建议还是中规中矩的按照课程进度一点一点仔细观看学习,并一定要把看完的视频中的代码自己手敲一遍,以加深理解和记忆
如果您有基础,可不必按部就班进行,可以拿你感兴趣的部分去学习,但一定要注意实践,并学会举一反三
2.3、讲师建议
1.最好看完视频之后,抛开视频,独立自己去把上课中的示例写一遍,看自己是否理解,如果不正确,可以回过头看再看下视频,如果反复,达到真正理解和熟练掌握的目的。
2.对于项目实战部分,一定要自己亲自动手做一遍,不要满足听完就OK了
3. 建议一边听视频,一边拿个纸和笔,做一些记录和笔记,这是一种非常好的学习习惯。
4. 一定不要过于依赖视频,要学会看API和使用百度,学会思考,学会举一反三
5. 最后祝您学有所成
课程是属于某个特定的专业技术,掌握该技术后,你可以从事以下职位的相关工作
1.大数据开发工程师
版权所有 © 2020 上海弘学教育科技有限公司 沪ICP备19002840号-3 网站地图