迷谈分布式一致性

2020年7月30日凌晨

2.2k 字 19 分钟

这篇文章的标题我也不知道是不是题文相关，依照分布式一致性和Zab协议这两个关键字搜索看了好多篇文章，但是依然很迷糊。
有些文章甚至研究的是区块链里的分布式一致性算法（大佬，告辞）。
所以叫迷谈，但尽量不胡谈，起码是参考过别的文章，不是瞎掰。

分布一致性类型

强一致性：写入什么数据读出来就是什么数据。任何时候读出来的数据都是最新的
弱一致性：不承诺能立即读到新值，也不承诺多久之后能读到新值，但会尽量确保在一个时间级别（例如秒级）能读到新值
最终一致性：是弱一致性的一种特例，保证在一定时间内能读到新值

CAP理论

分布式系统只能最多同时满足可用性、一致性和分区容错性的其中两个。
由于分布式系统的分区特性是无法避免的，所以实际上分布式系统只能在可用性和一致性之间做妥协。

一致性(Consistency)：数据在任何时候都是一致的（强一致性）
可用性(Availability)：服务一直处于可用状态，在有限时间内返回结果（强可用性）
分区容错性(Partition tolerance)：当系统出现网络分区故障时，仍能对外提供满足一致性和可用性的服务

BASE理论

BASE理论的核心想法是，即使做不到强一致性，也至少要保证最终一致性，允许可用性只要求基本可用以加强一致性。

基本可用(Basically Available)：系统出现故障时允许丢失部分可用性，例如增加响应时间，服务降级等
软状态(Soft state)：允许系统数据存在中间状态，即系统的不同节点之间的数据同步存在延迟
最终一致性(Eventually consistent)：系统的所有节点经过一段时间的同步之后都会达到一致

两阶段提交

两阶段提交以及升级版的三阶段提交都是只是缓解了数据不一致的问题，并没有完全解决问题。
看步骤感觉跟分布式事务的两阶段提交和TCC(Try Confirm Cancel)有点像，不知道是不是同一个东西。

将数据发送到全部节点，等待节点确认
如果全部节点都确认了，则向全部节点发送提交，否则返回失败

Paxos协议

网上说好难理解，看过的那几篇文章都没展开介绍，所以就懒得写了。

Raft协议

Raft里，节点有三种状态，且同时只会处于其中一种状态：

从节点：初始时节点都是从节点状态
候选节点：当从节点收不到主节点的心跳，从节点会变为候选节点
主节点：候选节点会让其他节点给自己投票，获取过半数票节点变为主节点。
读操作全部节点处理，写操作主节点处理。
写同步我看文章理解是类似二段提交（那这样子怎么就解决了呢？）

ZAB协议

ZAB全称Zookeeper Atomic Broadcast（zookeeper原子广播），据说参考了Paxos，是zookeeper里的分布式一致性的实现。
虽然我不晓得Paxos是啥样，但是有其中一篇文章说ZAB是简化版的两阶段提交，我看来确实有点像两阶段提交，还是说其实都像。
zookeeper的节点除了主节点和从节点以外还有观察节点，但是观察节点不参与投票，所以Zab协议并没有观察节点的什么事。
zookeeper的读操作可以由全部节点直接处理，而从节点和观察节点接受到写操作会转发给主节点处理。
ZAB协议包含两部分，分别是正常状态下的消息广播和异常状态下的崩溃恢复。