高洪涛《24讲吃透分布式数据库》:大厂数据存储利器,后端工程师进阶必备

高洪涛《24讲吃透分布式数据库》:大厂数据存储利器,后端工程师进阶必备插图

互联网数据增长是爆发式的,单机数据库很快触到容量与性能的瓶颈,业内经历了 SQL 到 NoSQL 再到 NewSQL 的技术探索。分布式数据库以更高并发访问量、更强的可扩展性、更快的数据访问速度,替代了传统关系型数据库,正在被行业广泛采纳。
身为开发者,深入理解分布式数据库原理与应用已经十分必要。

专栏解读

这个专栏为你摒弃过时与不重要的技术细节,给你精简的原理,拓展到实用的实际案例,让你对分布式数据库能够活学活用。专栏分为以下 4 大模块:

  • 模块一,分布式数据历史演变及其核心原理。 从历史背景出发,带你了解分布式数据库要解决的问题、应用场景,以及核心技术特点。
  • 模块二,存储引擎——分布式数据库的高性能保证。 本模块带你理解典型存储引擎,分布式索引、日志型存储、事务处理等,其中会特别介绍分布式数据库与传统数据库在存储层面上的差异。
    学完你会更加理解分布式数据库的数据一致性和分布式事务两大特性,明白为什么一些特定存储引擎更适合去构建分布式数据库,这些底层逻辑是你接下来学习的基础,也帮助你在未来工作中进行技术选型。
  • 模块三,分布式系统——分布式数据库的高扩展性保证。 分布式系统知识很多,但是本模块精简了分布式系统中与数据存储相关的领域,带你了解分布式系统设计原理、算法,包含错误侦测、领导选举、数据可靠传播、分布式事务、共识算法等。学完这些,让你对分布式场景下海量数据存储更加得心应手。
  • 模块四,知识拓展。 这一模块和你探讨分布式数据库的现状与发展,从关系型数据库结合数据库中间件,到最新型分布式数据库,了解它们成功的关键,同时将它们与之前模块中所介绍的技术原理进行相应的映射,让你的知识体系更加丰富。

高洪涛

前当当网系统架构师,前华为云技术专家
美国 ServiceMesh 服务商 Tetrate 创始工程师,Apache ShardingSphere PMC 成员,是该项目原始作者之一,同时参与 Apache SkyWalking、Elastic-Job 等知名开源项目。对分布式数据库、容器调度、微服务、ServiceMesh 等技术有深入的了解。

课程目录

开篇词

  • 开篇词 | 吃透分布式数据库,提升职场竞争力

模块一:分布式数据库的历史演变与核心原理

  • 01 | 导论:什么是分布式数据库?聊聊它的前世今生
  • 02 | SQL vs NoSQL:一次搞清楚五花八门的“SQL”
  • 03 | 数据分片:如何存储超大规模的数据?
  • 04 | 数据复制:如何保证数据在分布式场景下的高可用?
  • 05 | 一致性与 CAP 模型:为什么需要分布式一致性?
  • 06 | 实践:设计一个最简单的分布式数据库

模块二:存储引擎——分布式数据库的高性能保证

  • 07 | 概要:什么是存储引擎,为什么需要了解它?
  • 08 | 分布式索引:如何在集群中快速定位数据?
  • 09 | 日志型存储:为什么选择它作为底层存储?
  • 10 | 事务处理与恢复(上):数据库崩溃后如何保证数据不丢失?
  • 11 | 事务处理与恢复(下):如何控制并发事务?
  • 12 | 引擎拓展:解读当前流行的分布式存储引擎

模块三:分布式系统——分布式数据库的高扩展性保证

  • 13 | 概要:分布式系统都要解决哪些问题?
  • 14 | 错误侦测:如何保证分布式系统稳定?
  • 15 | 领导选举:如何在分布式系统内安全地协调操作?
  • 16 | 再谈一致性:除了 CAP 之外的一致性模型还有哪些?
  • 17 | 数据可靠传播:反熵理论如何帮助数据库可靠工作?
  • 18 | 分布式事务(上):除了 XA,还有哪些原子提交算法吗?
  • 19 | 分布式事务(下):Spanner 与 Calvin 的巅峰对决
  • 20 | 共识算法:一次性说清楚 Paxos、Raft 等算法的区别
  • 21 | 知识串讲:如何取得性能和可扩展性的平衡?

模块四:知识拓展——探究当代分布式数据库

  • 22 | 发展与局限:传统数据库在分布式领域的探索
  • 23 | 数据库中间件:传统数据库向分布式数据库的过渡
  • 24 | 现状解读:分布式数据库的最新发展情况

加餐及结束语

  • 加餐1 | 概念解析:云原生、HTAP、图与内存数据库
  • 加餐2 | 数据库选型:我们该用什么分布式数据库?
  • 结束语 | 分布式数据库,未来可期