fcamel 技術隨手記: Scale out, HA, backup

2010年12月22日星期三

Scale out、high availability、backup 三者是不同的事, 之前對這幾個詞很陌生, 備忘一下它們的差別。

Replication 可以同時 scale out 讀取的操作和當作讀取的 HA, 但不是 backup。舉例來說, 不小心刪錯資料, slave 上的資料也一起飛了。所以 backup 要另外做。
Replication 無法保證寫入的 HA, 因為 master 和 slave 之間會因延遲同步而少資料。
針對寫入操作的 HA, DRBD 看起來是最穩且易於實作的方案。但 DRBD 沒有附帶 scale out, 備份機就是待機狀態。
MMM 可用作寫入的 HA, 備份機可充當讀取的 replication。
Sharding (partition) 用來 scale out 寫入的操作, 沒包含 HA。

結論是 backup 要分開規劃, scale out 和 HA 也要分開規劃。寫入量不大的話, 可以先用 replication 擋著。反之, 要用 sharding 來 scale out, 用 DRBD 或 MMM 做 HA。

順便記一下 backup 的心得:

Backup 分為 raw backup 和 logical backup, 各有利弊。若 file system 有支援 snapshot, 在 slave 上做 raw backup, 不管是執行時間還是占用的空間, 都挺划算的。切記要搭配 crash-safe 的方案, 如 MySQL + InnoDB。
針對 InnoDB 做 logical backup 的話, 用 XtraBackup 較快。
一定要測 restore, 我半信半疑的測了一下, 馬上發現少備份使用者帳號的 DB ......

大概有個概念了, 接下來先做 replication 和 backup, 將 DB 操作包在自己寫的 lib 裡, 待需要 scale out 時比較好套。之後有更深的需求再來細讀吧。

fcamel 技術隨手記