Cloud Monitoring 總覽

本文件將概略說明 Cloud Monitoring 提供的服務。這些服務可協助您瞭解應用程式和其他 Trusted Cloud by S3NS 服務的行為、健康狀態和效能。Cloud Monitoring 會自動收集並儲存大多數 Trusted Cloud by S3NS 服務的效能資訊。

收集的指標

Cloud Monitoring 會收集並儲存 由 Trusted Cloud by S3NS 服務產生的系統指標。這些指標可提供服務運作方式的相關資訊。

查詢指標

建議您使用 Grafana 和 PromQL 查詢及視覺化度量資料。詳情請參閱「Cloud Monitoring 中的 PromQL」。

Cloud Monitoring API 也支援讀取指標資料。詳情請參閱 timeSeries.list 參考資料頁面。使用 Monitoring API 擷取指標資料時,API 指令中的查詢可以使用 Monitoring 篩選器運算式。

Cloud Monitoring 資料模型

本節將介紹 Cloud Monitoring 資料模型:

  • 「指標類型」是指計量項目,指標類型範例包括虛擬機器的 CPU 使用率,以及磁碟的使用百分比。

  • 「時間序列」是一種資料結構,含有加上時間戳記的指標評估結果,以及這些評估結果的來源和意義相關資訊。

以下是時間序列包含的詳細內容:

  • points 陣列包含加上時間戳記的測量結果。

    以下是包含兩個值的 points 陣列範例:

      "points": [
        {
          "interval": {
            "startTime": "2020-07-27T20:20:21.597143Z",
            "endTime": "2020-07-27T20:20:21.597143Z"
          },
          "value": {
            "doubleValue": 0.473005
          }
        },
        {
          "interval": {
            "startTime": "2020-07-27T20:19:21.597239Z",
            "endTime": "2020-07-27T20:19:21.597239Z"
          },
          "value": {
            "doubleValue": 0.473025
          }
        },
      ],
    

    如要瞭解某個值的含義,您需要參考時間序列中包含的其他資料,以及該資料的定義。

  • resource 欄位會說明正在監控的硬體或軟體元件。在 Cloud Monitoring 中,硬體或軟體元件稱為「受控資源」。監控的資源範例包括 Compute Engine 執行個體和 App Engine 應用程式。如需受控資源清單,請參閱受控資源清單

    以下是 resource 欄位的範例:

      "resource": {
        "type": "gce_instance",
        "labels": {
          "instance_id": "2708613220420473591",
          "zone": "us-east1-b",
          "project_id": "sampleproject"
        }
      }
    
    • type 欄位會將受監控的資源列為 gce_instance,表示這些測量結果是在 Compute Engine VM 執行個體上取得。

    • labels 欄位包含鍵/值組合,可提供受控資源的額外資訊。對於 gce_instance 類型,標籤會標示要監控的 VM 執行個體。

  • metric 欄位會說明要評估的項目。

    以下是 metric 欄位的範例:

      "metric": {
        "labels": {
          "instance_name": "test"
        },
        "type": "compute.googleapis.com/instance/cpu/utilization"
      },
    
    • 對於 Trusted Cloud by S3NS 服務,type 欄位會指定服務和要監控的項目。在這個範例中,Compute Engine 服務會評估 CPU 使用率。
  • metricKind 欄位會說明時間序列中相鄰測量值之間的關係:

    • GAUGE 指標會儲存特定時間點所測量物件的值,例如每小時的溫度記錄。

    • CUMULATIVE 指標會儲存特定時間點所測量物件的累積值,例如車輛的里程表。

    • DELTA 指標會儲存指定期間內所評估項目的價值變化,例如股票摘要,顯示股票的收益或損失。

  • valueType 欄位會說明評估值的資料類型:INT64DOUBLEBOOLSTRINGDISTRIBUTION

Cloud Monitoring 會為每個資源和指標標籤值組合寫入一個時間序列。您可以使用這些標籤來分組及篩選時間序列。

後續步驟