このページの一部またはすべての情報は、S3NS の Cloud de Confiance に適用されない場合があります。詳細については、Google Cloud との違いをご確認ください。

レプリケーションラグ

MySQL | PostgreSQL | SQL Server

このページでは、Cloud SQL リードレプリカのレプリケーションラグのトラブルシューティングと修正方法について説明します。

概要

Cloud SQL リードレプリカは、PostgreSQL ストリーミングレプリケーションを使用します。変更は、プライマリインスタンスの先行書き込みログ（WAL）に書き込まれます。WAL sender がレプリカの WAL receiver に WAL を送信し、そこで適用されます。

レプリケーションラグは、次のようないくつかのシナリオで発生する可能性があります。

プライマリインスタンスが、レプリカに変更を十分な速さで送信できない。
レプリカが変更を十分な速さで受信できない。
レプリカが変更を十分な速さで適用できない。

上記の最初の 2 つのシナリオは、network_lag 指標でモニタリングできます。3 つめは replica_lag 指標を使用してモニタリングされます。replica_lag が高い場合、レプリカがレプリケーションの変更を十分な速さで適用できないことを意味します。合計ラグは、replica_byte_lag 指標を使用してモニタリングできます。この指標には詳細を示すラベルがあります。こうした指標の詳細については、レプリケーションラグをモニタリングするをご覧ください。

レプリカが適切にプロビジョニングされていることを確認する

プライマリインスタンスよりも小さいレプリカインスタンス（vCPU とメモリが少ないなど）では、レプリケーションの遅延が発生する可能性があります。小さいレプリカでは、大きいプライマリインスタンスとは異なるデフォルトの構成フラグが設定されている場合もあります。レプリケーションの負荷を処理するのに十分なリソースを確保するため、レプリカインスタンスはプライマリインスタンスと同じサイズか、それ以上にすることをおすすめします。

レプリカの CPU 使用率が高いと、レプリケーションが遅延する可能性もあります。レプリカの CPU 使用率が高い場合（90% を超えるなど）は、レプリカの CPU 容量を増やすことを検討してください。

SHOW ALL コマンドを使用すると、レプリカインスタンスとプライマリインスタンスの構成を表示して、違いを比較できます。

クエリとスキーマを最適化する

このセクションでは、レプリケーションのパフォーマンスを改善するためによく実行するクエリとスキーマの最適化について説明します。

リードレプリカでの長時間実行クエリ

レプリカの長時間実行クエリが原因で、Cloud SQL のレプリケーションがブロックされる場合があります。これは、レプリカに対するクエリで読み取られている行にレプリケーションが変更（VACUUM オペレーションなど）を適用しようとしている場合に発生することがあります。

オンライントランザクション処理（OLTP）とオンライン分析処理（OLAP）に別々のレプリカを使用し、長時間実行クエリのみを OLAP レプリカに送信することをおすすめします。

長時間実行トランザクションによって発生するレプリケーションの遅延やブロックを解決するには、次のことをおすすめします。

スタンバイ遅延フラグを調整する。max_standby_archive_delay フラグと max_standby_streaming_delay フラグは、レプリケーションと競合するスタンバイクエリをレプリカがキャンセルするまでの待機時間を制御します。一般的に、値は 30～60 秒程度が妥当です。pg_stat_database_conflicts ビューで、クエリの競合に関する分析情報を確認できます。
hot_standby_feedback フラグを有効にする。レプリカで hot_standby_feedback フラグを on に設定すると、プライマリのバキュームオペレーションを遅延させることができます。ただし、これによりプライマリでテーブルが肥大化する可能性があるというトレードオフがあります。

詳細については、PostgreSQL のドキュメントをご覧ください。

ネットワークラグが大きい

ネットワークラグが大きい場合は、プライマリが WAL レコードを送信していないか、レプリカが WAL レコードを十分な速度で受信していないことを示します。次の原因が考えられます。

クロスリージョンレプリケーション。異なるリージョン間でレプリケートすると、ネットワークレイテンシが高くなる可能性があります。
プライマリの CPU 使用率が高い。プライマリの CPU が 90% を超えると、WAL sender プロセスの CPU 時間が不十分になる可能性があります。プライマリの負荷を減らすか、CPU を増やすことを検討してください。
レプリカの CPU 使用率が高い。レプリカの CPU が 90% を超えると、WAL receiver プロセスの CPU 時間が不十分になる可能性があります。レプリカの負荷を軽減するか、CPU を増やすことを検討してください。
ネットワーク帯域幅の問題またはディスク I/O のボトルネック。リージョンを近くにするか、スループットの高いディスク構成を使用すると、この問題を解決できる可能性があります。リージョン間のトラフィックを削減するために、プライマリインスタンスの wal_compression フラグの値を変更することを検討してください。

cloudsql.googleapis.com/database/replication/network_lag 指標を使用して、ネットワークラグをモニタリングできます。この指標の上限は 25 秒ですが、実際のラグはそれよりも長い場合があります。

この network_lag 指標は、replica_lag_type ラベルで示される sent_location ラグをバイト単位で測定する cloudsql.googleapis.com/database/postgresql/replication/replica_byte_lag 指標に似ています。

DDL による排他ロック

データ定義言語（DDL）コマンド（ALTER TABLE や CREATE INDEX など）では、排他的ロックによってレプリカでレプリケーションラグが発生することがあります。ロックの競合を回避するには、レプリカでクエリの負荷が低いときに DDL の実行をスケジュールすることを検討してください。

詳細については、PostgreSQL のドキュメントをご覧ください。

レプリカの過負荷

リードレプリカが受信するクエリが多すぎると、レプリケーションがブロックされることがあります。読み取りを複数のレプリカに分割して、各レプリカの負荷を減らすことを検討してください。

クエリの急増を回避するには、アプリケーションロジックまたはプロキシレイヤ（1 つ使用している場合）でレプリカの読み取りクエリを抑制することを検討してください。

プライマリインスタンスでアクティビティが急増した場合は、更新を分散させることを検討してください。

モノリシックなプライマリデータベース

プライマリデータベースを垂直方向（または水平方向）に分割して、1 つ以上のラグテーブルが他のすべてのテーブルを抑制しないようにすることを検討してください。

レプリケーションラグをモニタリングする

replica_lag 指標と network_lag 指標を使用してレプリケーションラグをモニタリングし、ラグの原因がプライマリデータベース、ネットワーク、レプリカのどれにあるのかを識別できます。

指標説明

指標	説明
レプリケーションラグ（`cloudsql.googleapis.com/database/replication/replica_lag`）	レプリカの状態がプライマリインスタンスの状態よりも遅れている秒数。これは、現在の時刻と、現在レプリカに適用されているトランザクションをプライマリデータベースが commit した時点のタイムスタンプとの差です。特に、レプリカが書き込みを受信していても、レプリカがデータベースへの書き込みをまだ適用していない場合、書き込みは遅延として記録される可能性があります。この指標は、レプリカの `now() - pg_last_xact_replay_timestamp()` を使用して計算されます。これはおおよその値です。レプリケーションが破損していると、レプリカはプライマリデータベースの状態がわからないため、この指標は合計ラグを示しません。
ラグバイト（`cloudsql.googleapis.com/database/postgres/replication/replica_byte_lag`）	プライマリデータベースの状態からのレプリカの状態の遅れ（バイト数）。`replica_byte_lag` は 4 つの時系列をエクスポートし、`replica_lag_type` ラベルは次のいずれかを示します。 sent_location: WAL が生成されたものの、レプリカにまだ送信されていないバイト数を示します。 write_location: 書き込みから送信ラグを差し引いた値が、送信されレプリカでまだ書き込まれていないネットワーク内の WAL バイトを示します。 lush_location: フラッシュから書き込みラグを差し引いた値が、レプリカに書き込まれレプリカでまだフラッシュされていない WAL バイトを示します。 replay_location: 合計ラグをバイト単位で示します。リプレイからフラッシュラグを差し引いたものがリプレイ遅延を示します。
ネットワークラグ（`cloudsql.googleapis.com/database/replication/network_lag`）	プライマリデータベースの commit からレプリカの WAL receiver に到達するまでにかかる時間（秒）。 `network_lag` がゼロまたはごくわずかであっても、`replica_lag` が高い場合は、WAL receiver がレプリケーションの変更を迅速に適用できないことを示します。

レプリケーションラグ
（cloudsql.googleapis.com/database/replication/replica_lag）

レプリカの状態がプライマリインスタンスの状態よりも遅れている秒数。これは、現在の時刻と、現在レプリカに適用されているトランザクションをプライマリデータベースが commit した時点のタイムスタンプとの差です。特に、レプリカが書き込みを受信していても、レプリカがデータベースへの書き込みをまだ適用していない場合、書き込みは遅延として記録される可能性があります。

この指標は、レプリカの now() - pg_last_xact_replay_timestamp() を使用して計算されます。これはおおよその値です。レプリケーションが破損していると、レプリカはプライマリデータベースの状態がわからないため、この指標は合計ラグを示しません。

ラグバイト
（cloudsql.googleapis.com/database/postgres/replication/replica_byte_lag）

プライマリデータベースの状態からのレプリカの状態の遅れ（バイト数）。replica_byte_lag は 4 つの時系列をエクスポートし、replica_lag_type ラベルは次のいずれかを示します。

sent_location: WAL が生成されたものの、レプリカにまだ送信されていないバイト数を示します。
write_location: 書き込みから送信ラグを差し引いた値が、送信されレプリカでまだ書き込まれていないネットワーク内の WAL バイトを示します。
lush_location: フラッシュから書き込みラグを差し引いた値が、レプリカに書き込まれレプリカでまだフラッシュされていない WAL バイトを示します。
replay_location: 合計ラグをバイト単位で示します。リプレイからフラッシュラグを差し引いたものがリプレイ遅延を示します。

ネットワークラグ
（cloudsql.googleapis.com/database/replication/network_lag）

プライマリデータベースの commit からレプリカの WAL receiver に到達するまでにかかる時間（秒）。

network_lag がゼロまたはごくわずかであっても、replica_lag が高い場合は、WAL receiver がレプリケーションの変更を迅速に適用できないことを示します。

レプリケーションを検証する

レプリケーションが機能していることを確認するには、レプリカに対して次のステートメントを実行します。

  select status, last_msg_receipt_time from pg_stat_wal_receiver;

レプリケーションが行われている場合は、ステータス streaming と最近の last_msg_receipt_time が表示されます。

  postgres=> select status, last_msg_receipt_time from pg_stat_wal_receiver;
    status   |     last_msg_receipt_time
  -----------+-------------------------------
  streaming | 2020-01-21 20:19:51.461535+00
  (1 row)

レプリケーションが行われていない場合、空の結果が返されます。

  postgres=> select status, last_msg_receipt_time from pg_stat_wal_receiver;
  status | last_msg_receipt_time
  --------+-----------------------
  (0 rows)

次のステップ:

リージョン移行または障害復旧のためにレプリカを昇格させる

レプリケーション ラグ

概要