尚硅谷·大数据项目Flink实时数仓

尚硅谷·大数据项目Flink实时数仓插图

课程简介

在大数据处理领域,实时和离线各占非常大的比重,本套视频教程综合展示实时数据处理领域的一个重要应用:实时数仓项目。项目从数据采集开始,分别讲解了针对不同数据采取的不同采集策略,使用的不同数据采集工具。在数据处理部分,将实时采集的数据按照数据建模要求进行合理分层,使用当前最火热的实时计算引擎Flink,对实时计算结果进行可视化展示。

内容包括:搭建用户行为数据的实时数据采集框架Flume-Kafka-Flink;采用Canal、Maxwell、Flink CDC三种方案实现业务数据的实时采集;分层搭建实时数据仓库,包括ODS层、DWD层、DIM层、DWM层、DWS层、ADS层;数据可视化接口的实现;ClickHouse技术的深入讲解……

每一部分讲解均参照实际开发环境,提供了多种问题的解决方案,引导学员对问题进行更深层的思考。通过本套教程的学习,你将掌握企业实际开发中实时数仓搭建的全流程,深入理解Flink的高阶应用实例,掌握开发环节多种框架技术。教程总计40小时+,附赠全部视频、代码、笔记及资料。

教程涵盖的关键技术点:
数仓架构深入讲解、离线架构与实时架构对比分析、SpringBoot项目搭建讲解、Nginx安装配置使用、Flink CDC深入案例分析、Maxwell与Canal对比分析、使用侧输出流分流操作、Flink与HBase交互、Flink状态编程应用、Flink CEP循环模式匹配、双流join、旁路缓存、异步IO编码、ClickHouse多引擎讲解、Flink SQL、数据可视化接口编写、Flink实战优化方案等。

课程目录

  • 001-课程介绍
  • 002-项目介绍
  • 003-采集模块-课程介绍
  • 004-采集模块-数仓分层之为什么分层
  • 005-采集模块-数仓分层之分层明细
  • 006-采集模块-整体需求介绍
  • 007-采集模块-离线架构分析之Sqoop&Flume
  • 008-采集模块-离线架构分析之FlumeTairDirSource问题提出&解决
  • 009-采集模块-离线架构分析之Kafka
  • 010-采集模块-离线架构分析之其他
  • 011-采集模块-实时架构分析
  • 012-采集模块-架构对比
  • 013-采集模块-日志数据采集之需求分析
  • 014-采集模块-日志数据采集之MockJar包测试
  • 015-采集模块-日志数据采集之SpringBoot简单介绍
  • 016-采集模块-日志数据采集之SpringBoot创建项目&简单测试
  • 017-采集模块-日志数据采集之SpringBoot创建项目&加参数测试
  • 018-采集模块-日志数据采集之数据落盘&写入Kafka 编码
  • 019-采集模块-日志数据采集之数据落盘&写入Kafka 本地测试
  • 020-采集模块-日志数据采集之数据落盘&写入Kafka 单机测试
  • 021-采集模块-日志数据采集之Nginx 介绍
  • 022-采集模块-日志数据采集之Nginx 安装&启动
  • 023-采集模块-日志数据采集之Nginx 配置负载均衡&测试
  • 024-采集模块-日志数据采集之集群测试
  • 025-采集模块-业务数据采集之建库&建表
  • 026-采集模块-业务数据采集之FlinkCDC 什么是CDC&对比
  • 027-采集模块-业务数据采集之FlinkCDC 介绍
  • 028-采集模块-业务数据采集之FlinkCDC DataStream方式 编码
  • 029-采集模块-业务数据采集之FlinkCDC DataStream方式 测试
  • 030-采集模块-业务数据采集之FlinkCDC DataStreamAPI 设置CK&打包&开启集群
  • 031-采集模块-业务数据采集之FlinkCDC DataStreamAPI 打包进行断点续传测
  • 032-采集模块-业务数据采集之FlinkCDC FlinkSQLAPI 编码&测试
  • 033-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 格
  • 034-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 编
  • 035-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 代
  • 036-采集模块-业务数据采集之FlinkCDC DataStreamAPI&FlinkSQL对比
  • 037-采集模块-业务数据采集之Maxwell 安装说明&测试
  • 038-采集模块-业务数据采集之Canal 安装说明&测试
  • 039-采集模块-业务数据采集之CDC对比
  • 040-采集模块-业务数据采集之读取MySQL数据并写入Kafka 编码
  • 041-采集模块-业务数据采集之读取MySQL数据并写入Kafka 测试
  • 042-DWD&DIM-课程介绍
  • 043-DWD&DIM-行为数据 需求分析
  • 044-DWD&DIM-行为数据 思路整理&消费Kafka数据
  • 045-DWD&DIM-行为数据 将数据转换为JSON对象
  • 046-DWD&DIM-行为数据 新老用户校验
  • 047-DWD&DIM-行为数据 侧输出流&写入Kafka
  • 048-DWD&DIM-行为数据 测试
  • 049-DWD&DIM-业务数据之需求分析
  • 050-DWD&DIM-业务数据之代码逻辑梳理
  • 051-DWD&DIM-业务数据之代码编写 消费数据并过滤
  • 052-DWD&DIM-业务数据之代码编写 读取配置表创建广播流
  • 053-DWD&DIM-业务数据之代码编写 配置表字段分析&建表&JavaBean
  • 054-DWD&DIM-业务数据之代码编写 开启配置表Binlog并测试
  • 055-DWD&DIM-业务数据之代码编写 连接主流&广播流并分析业务逻辑
  • 056-DWD&DIM-业务数据之代码编写 创建TableProcessFunction并初始化相关参数
  • 057-DWD&DIM-业务数据之代码编写 处理广播流数据 解析数据&建表
  • 058-DWD&DIM-业务数据之代码编写 处理广播流数据 写入状态
  • 059-DWD&DIM-业务数据之代码编写 处理主流数据 读取状态&过滤字段
  • 060-DWD&DIM-业务数据之代码编写 处理主流数据 补充SinkTable&分流
  • 061-DWD&DIM-业务数据之代码编写 检查代码
  • 062-DWD&DIM-业务数据之代码编写 测试准备
  • 063-DWD&DIM-业务数据之代码编写 测试
  • 064-DWD&DIM-业务数据之代码编写 将数据写入HBase 编码
  • 065-DWD&DIM-业务数据之代码编写 将数据写入Kafka 编码
  • 066-DWD&DIM-业务数据之整体测试 环境准备
  • 067-DWD&DIM-业务数据之整体测试 测试完成
  • 068-ODS&DWD&DIM-小总结
  • 069-ODS&DWD&DIM-SQL分享 需求说明&建表&导数据
  • 070-ODS&DWD&DIM-SQL分享 方案一
  • 071-ODS&DWD&DIM-SQL分享 方案二
  • 072-ODS&DWD&DIM-SQL分享 HiveOnSpark Bug说明
  • 073-DWM层-需求分析
  • 074-DWM层-访客UV 需求分析
  • 075-DWM层-访客UV 代码编写 消费数据并转换为JSON对象
  • 076-DWM层-访客UV 代码编写 过滤数据
  • 077-DWM层-访客UV 代码编写 设置状态超时时间防止状态过大
  • 078-DWM层-访客UV 代码测试
  • 079-DWM层-跳出明细 需求分析
  • 080-DWM层-跳出明细 代码编写
  • 081-DWM层-跳出明细 代码测试
  • 082-DWM层-跳出明细 测试
  • 083-DWM层-跳出明细 CEP 循环模式
  • 084-DWM层-订单宽表 需求分析
  • 085-DWM层-订单宽表 双流JOIN 官方文档说明
  • 086-DWM层-订单宽表 双流JOIN 代码编写
  • 087-DWM层-订单宽表 双流JOIN 代码测试
  • 088-DWM层-订单宽表 代码编写 消费Kafka数据&转换JavaBean&提取事件时间
  • 089-DWM层-订单宽表 代码编写 订单与订单明细表双流JOIN
  • 090-DWM层-订单宽表 代码测试 准备工作
  • 091-DWM层-订单宽表 代码测试 测试完成
  • 092-DWM层-订单宽表 关联维度 思路梳理
  • 093-DWM层-订单宽表 关联维度 JDBCUtil 返回值&参数说明
  • 094-DWM层-订单宽表 关联维度 JDBCUtil 查询&封装泛型对象
  • 095-DWM层-订单宽表 关联维度 JDBCUtil 测试
  • 096-DWM层-订单宽表 关联维度 DimUtil封装&优化的必要性
  • 097-DWM层-订单宽表 关联维度 优化1旁路缓存 思路分析
  • 098-DWM层-订单宽表 关联维度 优化1旁路缓存 Redis工具类&Key的设计
  • 099-DWM层-订单宽表 关联维度 优化1旁路缓存 代码编写
  • 100-DWM层-订单宽表 关联维度 优化1旁路缓存 代码测试
  • 101-DWM层-订单宽表 回顾
  • 102-DWM层-订单宽表 关联维度 优化2 异步IO说明
  • 103-DWM层-订单宽表 关联维度 优化2 异步IO编码步骤
  • 104-DWM层-订单宽表 关联维度 优化2 异步IO编码 初始化函数
  • 105-DWM层-订单宽表 关联维度 优化2 异步IO编码 异步函数完成
  • 106-DWM层-订单宽表 关联维度 优化2 异步IO编码 测试准备
  • 107-DWM层-订单宽表 关联维度 优化2 异步IO编码 测试完成
  • 108-DWM层-订单宽表 关联维度 补充其他维度信息
  • 109-DWM层-订单宽表 最终测试
  • 110-DWM层-订单宽表 不丢维度数据说明
  • 111-DWM层-支付宽表 需求分析
  • 112-DWM层-支付宽表 代码编写
  • 113-DWM层-支付宽表 代码测试
  • 114-DWM层-支付宽表 时间工具类说明
  • 115-DWS层-课程介绍
  • 116-DWS层-访客主题宽表 需求分析
  • 117-DWS层-访客主题宽表 思路整理&读取Kafka数据
  • 118-DWS层-访客主题宽表 处理输出流&union&提取时间戳分组
  • 119-DWS层-访客主题宽表 开窗&聚合
  • 120-DWS层-访客主题宽表 打印测试
  • 121-DWS层-ClickHouse 课程介绍
  • 122-DWS层-ClickHouse 概述&特点
  • 123-DWS层-ClickHouse 安装准备工作
  • 124-DWS层-ClickHouse 安装&启动
  • 125-DWS层-ClickHouse 数据类型
  • 126-DWS层-ClickHouse 简单引擎介绍
  • 127-DWS层-ClickHouse MergeTree
  • 128-DWS层-ClickHouse MergeTree之Partition By
  • 129-DWS层-ClickHouse MergeTree之Primary Key
  • 130-DWS层-ClickHouse MergeTree之Order By
  • 131-DWS层-ClickHouse MergeTree之TTL
  • 132-DWS层-ClickHouse ReplacingMergeTree
  • 133-DWS层-ClickHouse SummingMergeTree
  • 134-DWS层-ClickHouse 引擎选择分析
  • 135-DWS层-ClickHouse SQL操作 一
  • 136-DWS层-ClickHouse SQL操作 二
  • 137-DWS层-ClickHouse 副本机制
  • 138-DWS层-ClickHouse 分片机制 说明
  • 139-DWS层-ClickHouse 分片机制 实操
  • 140-DWS层-访客主题 ClickHouseUtil 创建
  • 141-DWS层-访客主题 ClickHouseUtil 封装
  • 142-DWS层-访客主题 ClickHouseUtil 封装完成
  • 143-DWS层-访客主题 ClickHouseUtil 测试完成
  • 144-DWS层-商品主题 需求分析
  • 145-DWS层-商品主题 JavaBean说明
  • 146-DWS层-商品主题 代码编写 思路整理&消费数据创建流
  • 147-DWS层-商品主题 代码编写 处理页面日志&收藏数据&购物车数据
  • 148-DWS层-商品主题 代码编写 处理订单&支付数据
  • 149-DWS层-商品主题 代码编写 处理退单&评价数据
  • 150-DWS层-商品主题 代码编写 分组开窗&聚合
  • 151-DWS层-商品主题 代码编写 关联维度&将数据写入ClickHouse
  • 152-DWS层-商品主题-整体测试
  • 153-DWS层-商品主题-需求分析
  • 154-DWS层-商品主题 代码编写 创建环境&使用DDL方式读取Kafka数据
  • 155-DWS层-商品主题 代码编写 分组开窗聚合
  • 156-DWS层-商品主题 代码编写 将动态表转换为流并打印
  • 157-DWS层-商品主题 代码编写 将数据写入ClickHouse&测试
  • 158-DWS层-关键词主题 需求分析
  • 159-DWS层-关键词主题 代码编写 分词工具类封装
  • 160-DWS层-关键词主题 代码编写 分词UDTF
  • 161-DWS层-关键词主题 代码编写 思路分析&读取数据&建表
  • 162-DWS层-关键词主题 代码编写 分词&开窗聚合
  • 163-DWS层-关键词主题 代码编写 动态表转换为流&写入ClickHouse
  • 164-DWS层-关键词主题 代码测试
  • 165-数据可视化-课程介绍
  • 166-数据可视化-Sugar 创建大屏
  • 167-数据可视化-Sugar 使用步骤介绍
  • 168-数据可视化-数据接口 项目构建
  • 169-数据可视化-数据接口 依赖导入&分层说明
  • 170-数据可视化-数据接口 GMV接口 Mapper完成
  • 171-数据可视化-数据接口 GMV接口 Service&Controller完成
  • 172-数据可视化-数据接口 GMV接口 测试
  • 173-数据可视化-数据接口 GMV接口 对接Sugar
  • 174-数据可视化-数据接口 品牌GMV接口 Mapper完成
  • 175-数据可视化-数据接口 品牌GMV接口 Service完成
  • 176-数据可视化-数据接口 品牌GMV接口 Controller完成
  • 177-数据可视化-数据接口 品牌GMV接口 测试完成
  • 178-数据可视化-数据接口 品牌GMV接口 对接Sugar
  • 179-数据可视化-数据接口 导入代码&品类GMV&SPU GMV
  • 180-数据可视化-数据接口 其他需求图表
  • 181-数据可视化-最终测试
  • 182-Flink优化-课程介绍
  • 183-Flink优化-资源优化之内存设置
  • 184-Flink优化-资源优化之并行度设置
  • 185-Flink优化-资源优化之RockDB配置
  • 186-Flink优化-资源优化之CheckPoint配置
  • 187-Flink优化-资源优化之ParameterTool的介绍
  • 188-Flink优化-反压处理之反压介绍&定位
  • 189-Flink优化-反压处理之反压问题解决
  • 190-Flink优化-数据倾斜之定位问题
  • 191-Flink优化-数据倾斜之KeyBy之前的数据倾斜
  • 192-Flink优化-数据倾斜之KeyBy之后直接聚合
  • 193-Flink优化-数据倾斜之KeyBy之后开窗聚合
  • 194-Flink优化-KafkaSource
  • 195-Flink优化-FlinkSQL优化之MiniBatch
  • 196-Flink优化-FlinkSQL优化之LocalGlobal
  • 197-Flink优化-FlinkSQL优化之SplitDistinct
  • 198-Flink优化-FlinkSQL优化之Agg With Filter
  • 199-Flink优化-FlinkSQL优化之TopN优化
  • 200-Flink优化-FlinkSQL优化之去重方案&其他