Compute Engine 會在兩個 Trusted Cloud by S3NS 區域中,維護每個區域磁碟的副本。每個副本都稱為可用區備用資源。當您將資料寫入磁碟時,Compute Engine 會將資料同步複製到兩個副本,確保高可用性 (HA)。在任何時間點,區域磁碟的磁碟複製狀態都會顯示磁碟是否能同步寫入兩個副本。磁碟的複製狀態取決於磁碟區域副本的副本狀態。可用區的副本狀態會顯示個別可用區副本的狀態,與磁碟上的最新資料相比。如果可用區備用資源包含最新的磁碟資料,則該備用資源會被視為與最新的磁碟資料同步。如果兩個可用區備用資源都已同步,則Hyperdisk 平衡高可用性磁碟會視為完全複製。
本文說明如何監控地區磁碟的副本狀態,以及一段時間內的磁碟複製狀態。您可以使用這份文件執行下列操作:
- 查看區域磁碟目前和過往的副本狀態。
- 如要只確認特定區域磁碟的區域複本是否已同步,請使用主控台進行監控。 Trusted Cloud
- 如要查看專案中所有磁碟的確切區域副本狀態,請使用 Cloud Monitoring 資訊主頁進行監控。
- 使用特定時間點的副本狀態資訊,判斷磁碟是否已完全複製。
如要進一步瞭解副本狀態和磁碟複製狀態,請參閱「關於同步磁碟複製」。
必要的角色
如要取得使用 Cloud Monitoring 查看複寫狀態所需的權限,請要求管理員授予下列 IAM 角色:
-
如要查看區域性磁碟指標 (下列其中一項):
-
專案的「監控檢視者」 (
roles/monitoring.viewer
) -
Monitoring 編輯者 (
roles/monitoring.editor
) 專案
-
專案的「監控檢視者」 (
如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。
使用 Trusted Cloud 控制台監控
本節說明如何使用 Trusted Cloud 控制台,監控 Hyperdisk Balanced 高可用性磁碟區的副本狀態和磁碟複製狀態。
檢查單一磁碟的區域副本是否已同步
您可以使用 Trusted Cloud 控制台,檢查地區磁碟的區域副本是否已與最新磁碟資料同步。
如要查看專案中所有區域磁碟的確切區域副本狀態詳細資訊,請使用 Cloud Monitoring 資訊主頁檢查區域副本狀態。
主控台
如要監控區域磁碟的區域副本狀態,請執行下列操作:
前往 Trusted Cloud 控制台的「Disks」(磁碟) 頁面。
在「Disks」頁面的「Name」欄中,選取要檢查副本狀態的磁碟。
系統會開啟所選磁碟的「管理磁碟」頁面,並顯示該磁碟的「詳細資料」分頁。
點按「可觀測性」分頁標籤。
「管理磁碟」頁面會顯示磁碟的監控資訊。
如要查看磁碟的過往副本狀態資訊,請前往「可觀測性」分頁,然後找到「區域永久磁碟複製狀態」圖表。
圖表會以兩條不同的線,顯示前一小時的可用區副本狀態值。
副本狀態值可以是下列其中一個值:
0
:副本未與最新磁碟資料同步。1
。備用資源會與最新的磁碟資料同步。
如要在特定時間點檢查區域複本的複本狀態值,請按照下列步驟操作:
- 將指標停留在圖表上,找出要檢查副本狀態的時間值。
- 如要查看區域副本的副本狀態值,請前往圖表底部。
- 選用:如要查看圖表線條代表的名稱和副本狀態值,請將指標懸停在任何特定時間值的圖表線條上。圖表會以工具提示醒目顯示該副本的名稱和特定時間的狀態。
選用:如要修改想查看副本狀態資料的時間範圍,請在「可觀測性」分頁頂端選取時間範圍。可用的選項如下:
- 1 小時:前一小時。這是預設值。
- 6 小時:前 6 小時。
- 1 天:前一天。
- 1 週:前一週。
- 1 個月:前一個月。
- 6 週:前 6 週。
自訂:您選擇的特定時間範圍。如要指定自訂監控時間範圍,請按一下「自訂」,然後執行下列操作:
- 在「開始日期和時間」欄位中,指定監控時間範圍的開始時間。您必須指定過去的時間。
- 在「結束日期和時間」欄位中,指定監控時間範圍的結束時間。您必須指定過去的時間。
- 如要儲存自訂監控時間範圍,請按一下「套用」。
判斷磁碟是否已完全複製
判斷區域副本是否已與最新磁碟資料同步後,您就能根據這項資訊判斷磁碟是否已完全複製。
如果兩個可用區備用資源的備用資源狀態值都是 1
,表示磁碟在任何時間點都已完全複製。如果不是這種情況,請檢查當時的確切副本狀態,瞭解磁碟是否降級或趕上進度。詳情請參閱「使用 Cloud Monitoring 指標進行監控」一文。
使用 Cloud Monitoring 指標進行監控
您可以使用 Cloud Monitoring 中的 Regional disk replica state
指標,查看所有區域磁碟的確切區域副本狀態詳細資訊。
關於「Regional disk replica state
」指標
您可以在 Cloud Monitoring 資訊主頁上,查看區域副本目前的磁碟副本狀態和歷來狀態。Compute Engine 每分鐘會擷取磁碟的副本狀態,並使用 Regional disk replica state
指標回報。不過,如果區域中斷影響了附加區域副本的運算執行個體,您就不會看到任何一個區域副本的 Regional disk replica state
指標資料。
以下是 Regional disk replica state
指標可能的值。區域備用磁碟一律會處於下列其中一種狀態。
Synced
:備用資源可用,會同步接收對磁碟執行的所有寫入作業,且磁碟上的所有資料都處於最新狀態。CatchingUp
:副本可用,但仍要從其他副本的磁碟上擷取資料。OutOfSync
:備用資源暫時無法使用,且與磁碟上的資料不同步。
如要瞭解指標定義,請參閱「Compute Engine 監控指標」一節。
您可以運用 Regional disk replica state
指標資料執行下列操作:
- 判斷區域磁碟的複製狀態。
- 查看區域磁碟的副本狀態記錄,瞭解容錯移轉架構是否正常運作,並在區域磁碟狀態變更時採取必要行動。
- 根據
Regional disk replica state
指標資料建立快訊、偵測副本狀態的任何變化,並採取必要行動。如要進一步瞭解如何建立以指標為基礎的快訊,請參閱「如何新增快訊政策」。
查看 Regional disk replica state
指標資料
如要查看所連線地區磁碟的區域副本狀態,請建構查詢並為 Regional disk replica state
指標建立臨時圖表。您可以在 Metrics Explorer 中使用選單導向介面、 Monitoring Query Language (MQL) 或 PromQL 執行這項操作。
選單導向介面
-
前往 Trusted Cloud 控制台的 leaderboard「Metrics Explorer」頁面:
如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
「指標探索工具」頁面隨即開啟,並顯示「查詢」分頁。
如要查看專案中每個區域副本的副本狀態資料,請選取
Regional disk replica state
指標的時間序列資料,然後在查詢窗格的工具列中執行下列操作,移除匯總篩選器:在「指標」選單中,按一下「選取指標」,然後依序選取「磁碟」>「磁碟」>「區域磁碟副本狀態」。
按一下 [套用]。
在「匯總」選單中,選取「未匯總 (無)」。
系統會顯示圖表,並以時間序列的形式,呈現每個副本前一小時的指標資料。您只會看到所連線磁碟區域副本的指標資料。
如要進一步瞭解如何為指標選取時間序列,請參閱「在使用 Metrics Explorer 時選取指標」。
如要同時查看圖表和表格,請按一下圖表頂端的「兩者」。
如要查看所有可用區域磁碟屬性的資料,請在表格檢視畫面頂端按一下「資料欄顯示選項...」
,選取所有資料欄,然後按一下「確定」。資訊主頁會顯示表格中每一列的下列欄位,以及這些欄位的目前值:
disk_id
:磁碟 IDzone
:建立地區磁碟的區域。replica_zone
:副本可用區state
:副本狀態storage_type
:磁碟的儲存空間類型value
:副本狀態的值
如要在圖表檢視畫面中查看相應時間序列的這項資料,請將指標停留在圖表中的目前時間。圖表會在工具提示中顯示這些值。
如要查看特定時間點的副本狀態記錄,請按照下列步驟操作:
將游標懸停在圖表上,選取特定時間值。資訊主頁會顯示專案中所有可用區副本在特定時間點的所有副本狀態指標資料。
在圖表檢視畫面中,這項資訊會顯示在工具提示內。
在表格檢視中,這類資訊會顯示為個別資料列。
請記下副本狀態和對應值。在任何時間點,如果特定狀態的值為
1
,則代表副本處於該狀態。在圖表檢視畫面中,查看所需磁碟 ID 和副本可用區的工具提示內,副本的狀態和值。
在表格檢視畫面中,檢查特定磁碟 ID 和備用資源區域的「狀態」和「值」欄。
如要進一步瞭解副本狀態及其值的意義,請參閱「瞭解
Regional disk replica state
指標資料」。選用:如要查看特定標籤的副本狀態資訊,請在「篩選」選單中選取要查看資料的標籤,然後完成對話方塊。你可以新增多個篩選器。
資訊主頁只會顯示已篩選標籤的指標資料。 如要進一步瞭解篩選器,請參閱「篩選圖表資料」。
舉例來說,如要查看特定磁碟的副本狀態資料,請執行下列操作:
- 在「篩選器」選單中,選取「名稱」標籤。
- 在「比較子」選單中,選取「= (等於)」。
- 在「Value」(值) 選單中,選取所需的磁碟名稱。
選用:如要判斷特定磁碟副本的同步時間百分比,請篩選特定磁碟和狀態的資料,然後使用匯總選單:
- 在「篩選器」選單中,選取「名稱」標籤。
- 在「比較子」選單中,選取「= (等於)」。
- 在「Value」(值) 選單中,選取磁碟名稱。
- 在「篩選器」選單中,選取「狀態」標籤。
- 在「比較子」選單中,選取「= (等於)」。
- 在「值」選單中,選取「已同步」。
- 在「Aggregation」(匯總) 選單中,選取「Mean by replica_zone」(依副本區域計算平均值)。
- 選取要查看資料的時間範圍。
資訊主頁會顯示指定時間範圍內,磁碟副本的平均
synced
狀態資料。將這項資料乘以 100,即可判斷副本同步處理的時間百分比。如果該時間範圍的平均值顯示為1
,表示副本一律會使用最新資料。平均值小於1
表示副本在指定時間範圍內的某個時間點未同步。如要進一步瞭解分組和對齊方式,請參閱「選擇圖表資料的顯示方式」。
選用:如要修改監控指標資料的時間範圍,請按一下資訊主頁頂端的「過去 1 小時」,然後選取所需的時間範圍。
您可以選取相對於目前時間的時間範圍,或指定所選的開始和結束時間。根據預設,畫面會顯示前一小時的指標資料。
MQL
-
前往 Trusted Cloud 控制台的 leaderboard「Metrics Explorer」頁面:
如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
「指標探索工具」頁面隨即開啟,並顯示「查詢」分頁。
在查詢窗格的工具列中,按一下名稱開頭為 < > 的按鈕。
在「語言」欄位中,選取「MQL」做為查詢語言。這個欄位位於同一工具列,可供您設定查詢格式。
選用:停用「自動執行」切換按鈕。
輸入查詢,然後按一下「執行查詢」。
啟用「自動執行」切換按鈕後,系統不會顯示「執行查詢」按鈕。
舉例來說,如要查看名為
disk-1
的磁碟副本狀態資料,請執行下列查詢:fetch gce_disk | metric 'compute.s3nsapis.fr/disk/regional/replica_state' | filter (metadata.system_labels.name == 'disk-=1') | group_by 1m, [value_replica_state_mean: mean(value.replica_state)] | every 1m
再舉一例,如要判斷名為
disk-1
的磁碟有多少時間處於副本同步狀態,請執行下列查詢:fetch gce_disk | metric 'compute.s3nsapis.fr/disk/regional/replica_state' | filter (metadata.system_labels.name == 'disk-1') && (metric.state == 'Synced') | group_by 1m, [value_replica_state_mean: mean(value.replica_state)] | every 1m | group_by [metric.replica_zone], [value_replica_state_mean_mean: mean(value_replica_state_mean)]
如要修改要監控指標資料的時間範圍,請在資訊主頁頂端按一下「過去 1 小時」,然後選取所需的時間範圍和時區。
您可以選取相對於目前時間的時間範圍,或指定所選的開始和結束時間。根據預設,畫面會顯示前一小時的指標資料。
PromQL
-
前往 Trusted Cloud 控制台的 leaderboard「Metrics Explorer」頁面:
如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
「指標探索工具」頁面隨即開啟,並顯示「查詢」分頁。
在查詢窗格的工具列中,按一下名稱開頭為 < > 的按鈕。
在「語言」欄位中,選取「PromQL」做為查詢語言。這個欄位位於同一工具列,可供您設定查詢格式。
選用:停用「自動執行」切換按鈕。
輸入查詢,然後按一下「執行查詢」。
啟用「自動執行」切換按鈕後,系統不會顯示「執行查詢」按鈕。
舉例來說,如要查看名為
disk-1
的磁碟副本狀態資料,請執行下列查詢:avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",metadata_system_name="disk-1"}[${__interval}])
再舉一例,如要判斷名為
disk-1
的磁碟有多少時間處於副本同步狀態,請執行下列查詢:avg by (replica_zone)(avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",state="Synced",metadata_system_name="disk-1"}[${__interval}]))
如要修改要監控指標資料的時間範圍,請在資訊主頁頂端按一下「過去 1 小時」,然後選取所需的時間範圍和時區。
您可以選取相對於目前時間的時間範圍,或指定所選的開始和結束時間。根據預設,畫面會顯示前一小時的指標資料。
使用指標資料判斷確切的區域副本狀態
如要瞭解區域磁碟的 Regional disk replica state
指標資料,請查看所產生圖表中的可用區副本的「狀態」和「值」欄。如果沒有在查詢中加入任何篩選器,會發生下列情況:
- 「狀態」欄會顯示區域備用資源的所有可能狀態,包括
Synced
、CatchingUp
和OutOfSync
。圖表會以時間序列的形式,顯示專案中所有區域磁碟的所有可用區副本的狀態。 - 「值」欄會指出區域副本是否處於特定磁碟副本狀態。這個資料欄會針對專案中所有區域磁碟的所有可用區副本,顯示每個 state 值的對應二進位值 (
0
或1
)。
如果任何可用區副本的「值」欄顯示特定磁碟副本狀態的 1
,則該可用區副本處於該特定狀態。如果 value 欄顯示特定狀態的 0
,表示該副本並非處於該特定狀態。在任何時間點,可用區備用資源都只會有一種磁碟備用資源狀態,且 value 欄中會顯示 1
。另外兩個磁碟副本狀態的 value 欄中則有 0
。
對於每個區域副本,圖表和表格會針對每個磁碟副本狀態顯示個別項目:Synced
、CatchingUp
和 OutOfSync
。
每個項目的「值」資料欄都是二進位值 (0
或 1
),表示副本是否處於該狀態。在任何時間點,區域副本都只會有一個副本狀態,且值為 1
。
判斷確切的磁碟複製狀態
您可以透過區域複本的複本狀態,判斷區域磁碟的複寫狀態,方法如下:
- 如果兩個可用區備用資源的
Synced
狀態值都是1
,則表示磁碟已完全複製。 - 如果其中一個可用區備用資源的
Synced
狀態值為1
,另一個可用區備用資源的CatchingUp
狀態值為1
,則表示磁碟正在趕上進度。 - 如果其中一個區域副本的
Synced
狀態值為1
,另一個區域副本的OutOfSync
狀態值為1
,則磁碟會降級。
舉例來說,假設有名為 my-disk1
的磁碟,且在 us-central1-a
和 us-central1-b
中有副本。下列情境顯示每個可能 my-disk1
複製狀態的區域副本,其 state 和 value 欄位的值:
完全複製
在這個情況下,us-central1-a
中的副本和 us-central1-b
中的副本都會更新為磁碟上的最新資料。圖表會顯示 my-disk1
的區域副本中,每個磁碟副本狀態的下列值:
replica_zone | state | value |
---|---|---|
us-central1-a |
Synced |
1 |
us-central1-a |
CatchingUp |
0 |
us-central1-a |
OutOfSync |
0 |
us-central1-b |
Synced |
1 |
us-central1-b |
CatchingUp |
0 |
us-central1-b |
OutOfSync |
0 |
最新消息
在這個情境中,us-central1-a
中的副本會使用磁碟上的資料更新,而 us-central1-b
中的副本則會趕上磁碟上的資料。圖表會顯示 my-disk1
區域副本的每個磁碟副本狀態的下列值:
replica_zone | state | value |
---|---|---|
us-central1-a |
Synced |
1 |
us-central1-a |
CatchingUp |
0 |
us-central1-a |
OutOfSync |
0 |
us-central1-b |
Synced |
0 |
us-central1-b |
CatchingUp |
1 |
us-central1-b |
OutOfSync |
0 |
惡化
在這種情況下,us-central1-a
中的副本會更新為磁碟上的資料,而 us-central1-b
中的副本則會失去同步。圖表會顯示 my-disk1
的區域副本中,每個磁碟副本狀態的下列值:
replica_zone | state | value |
---|---|---|
us-central1-a |
Synced |
1 |
us-central1-a |
CatchingUp |
0 |
us-central1-a |
OutOfSync |
0 |
us-central1-b |
Synced |
0 |
us-central1-b |
CatchingUp |
0 |
us-central1-b |
OutOfSync |
1 |
後續步驟
- 建立及管理區域磁碟。
- 瞭解如何使用地區磁碟建構高可用性服務。