<code id="ymukc"><xmp id="ymukc">

MySQL并行復制的深入淺出

MySQL   2018-08-02 11:14:25 發布
您的評價:
     
0.0
收藏     0收藏
文件夾
標簽
(多個標簽用逗號分隔)

一、并行復制的背景

  • 首先,為什么會有并行復制這個概念呢?
1.DBA都應該知道,MySQL的復制是基于binlog的。  
2.MySQL復制包括兩部分,IO線程 和 SQL線程。  
3.IO線程主要是用于拉取接收Master傳遞過來的binlog,并將其寫入到relay log  
4.SQL線程主要負責解析relay log,并應用到slave中  
5.不管怎么說,IO和SQL線程都是單線程的,然后master卻是多線程的,所以難免會有延遲,為了解決這個問題,多線程應運而生了。  
6.IO多線程?  
6.1 IO沒必要多線程,因為IO線程并不是瓶頸啊
7.SQL多線程?
7.1 沒錯,目前最新的5.6,5.7,8.0 都是在SQL線程上實現了多線程,來提升slave的并發度


接下來,我們就來一窺MySQL在并行復制上的努力和成果吧

二、重點

是否能夠并行,關鍵在于多事務之間是否有鎖沖突,這是關鍵。 下面的并行復制原理就是在看如何讓避免鎖沖突

三、MySQL5.6 基于schema的并行復制

slave-parallel-type=DATABASE(不同庫的事務,沒有鎖沖突)

之前說過,并行復制的目的就是要讓slave盡可能的多線程跑起來,當然基于庫級別的多線程也是一種方式(不同庫的事務,沒有鎖沖突)

先說說優點: 實現相對來說簡單,對用戶來說使用起來也簡單

再說說缺點: 由于是基于庫的,那么并行的粒度非常粗,現在很多公司的架構是一庫一實例,針對這樣的架構,5.6的并行復制無能為力。當然還有就是主從事務的先后順序,對于5.6也是個大問題

話不多說,來張圖好了

四、MySQL5.7 基于group commit的并行復制

slave-parallel-type=LOGICAL_CLOCK : Commit-Parent-Based模式(同一組的事務[last-commit相同],沒有鎖沖突. 同一組,肯定沒有沖突,否則沒辦法成為同一組)

slave-parallel-type=LOGICAL_CLOCK : Lock-Based模式(即便不是同一組的事務,只要事務之間沒有鎖沖突[prepare階段],就可以并發。 不在同一組,只要N個事務prepare階段可以重疊,說明沒有鎖沖突)

group commit,之前的文章有詳細描述,這里不多解釋。MySQL5.7在組提交的時候,還為每一組的事務打上了標記,現在想想就是為了方便進行MTS吧。

我們先看一組binlog

last_committed=0 sequence_number=1
last_committed=1 sequence_number=2
last_committed=2 sequence_number=3
last_committed=3 sequence_number=4
last_committed=4 sequence_number=5
last_committed=4 sequence_number=6
last_committed=4 sequence_number=7
last_committed=6 sequence_number=8
last_committed=6 sequence_number=9
last_committed=9 sequence_number=10

4.1 Commit-Parent-Based模式

4.2 Lock-Based模式

五、MySQL8.0 基于write-set的并行復制

基于主鍵的沖突檢測(binlog_transaction_depandency_tracking = COMMIT_ORDERE|WRITESET|WRITESET_SESSION, 修改的row的主鍵或非空唯一鍵沒有沖突,即可并行)

5.7.22 也支持了 write-set 機制

  • 事務依賴關系:binlog_transaction_depandency_tracking = COMMIT_ORDERE|WRITESET|WRITESET_SESSION
COMMIT_ORDERE: 繼續基于組提交方式
WRITESET: 基于寫集合決定事務依賴
WRITESET_SESSION: 基于寫集合,但是同一個session中的事務不會有相同的last_committed
  • 事務檢測算法:transaction_write_set_extraction = OFF| XXHASH64 | MURMUR32

MySQL會有一個變量來存儲已經提交的事務HASH值,所有已經提交的事務所修改的主鍵(或唯一鍵)的值經過hash后都會與那個變量的集合進行對比,來判斷改行是否與其沖突,并以此來確定依賴關系

這里說的變量,可以通過這個設置大小: binlog_transaction_dependency_history_size

這樣的粒度,就到了 row級別了,此時并行的粒度更加精細,并行的速度會更快,某些情況下,說slave的并行度超越master也不為過(master是單線程的寫,slave也可以并行回放)

六、如何讓slave的并行復制和master的事務執行的順序一致呢

5.7.19 之后,可以通過設置 slave_preserve_commit_order = 1

官方解釋:  
For multithreaded slaves, enabling this variable ensures that transactions are externalized on the slave in the same order as they appear in the slave's relay log.   
Setting this variable has no effect on slaves for which multithreading is not enabled.   
All replication threads (for all replication channels if you are using multiple replication channels) must be stopped before changing this variable.   
--log-bin and --log-slave-updates must be enabled on the slave.
In addition --slave-parallel-type must be set to LOGICAL_CLOCK.

Once a multithreaded slave has been started, transactions can begin to execute in parallel.   
With slave_preserve_commit_order enabled, the executing thread waits until all previous transactions are committed before committing.   
While the slave thread is waiting for other workers to commit their transactions it reports its status as Waiting for preceding transaction to commit.

大致實現原理就是:excecution階段可以并行執行,binlog flush的時候,按順序進行。 引擎層提交的時候,根據binlog_order_commit也是排隊順序完成  
換句話說,如果設置了這個參數,master是怎么并行的,slave就怎么辦并行

 

來自:http://keithlan.github.io/2018/07/31/mysql_mts_detail/

 

六合特码资料
<code id="ymukc"><xmp id="ymukc">
<code id="ymukc"><xmp id="ymukc">

擴展閱讀

各版本MySQL并行復制的實現及優缺點
MySQL 5.7 并行復制實現原理與調優
高性能Mysql主從架構的復制原理及配置詳解
高性能Mysql主從架構的復制原理及配置詳解
理解 MySQL(3):復制(Replication)

為您推薦

MySQL5.6:基于GTID的主從復制
MySQL 5.7 并行復制實現原理與調優
MySQL Cluster 開發環境簡明部署(中文)
巧用Percona Toolkit解決MySQL主從不同步問題
MYSQL數據庫的優化

更多

MySQL
相關文檔  — 更多
相關經驗  — 更多
相關討論  — 更多