Cloud Monitoring 概览

本文档简要介绍了 Cloud Monitoring 提供的服务。这些服务可帮助您了解应用和其他 Trusted Cloud by S3NS 服务的行为、运行状况和性能。Cloud Monitoring 会自动收集和存储大多数 Trusted Cloud by S3NS 服务的性能信息。

收集的指标

Cloud Monitoring 会收集并存储服务生成的系统指标 Trusted Cloud by S3NS 。这些指标提供有关服务运行状况的信息。

查询指标

我们建议您使用 Grafana 和 PromQL 查询和可视化指标数据。如需了解详情,请参阅 Cloud Monitoring 中的 PromQL

Cloud Monitoring API 还支持读取指标数据。如需了解详情,请参阅 timeSeries.list 参考页面。使用 Monitoring API 检索指标数据时,API 命令中的查询可以使用 Monitoring 过滤条件表达式。

Cloud Monitoring 数据模型

本部分介绍 Cloud Monitoring 数据模型:

  • 指标类型描述的是衡量的内容。指标类型示例包括虚拟机的 CPU 利用率和已使用的磁盘百分比。

  • 时间序列是一种数据结构,包含指标的带时间戳的测量结果以及关于这些测量结果的来源和含义的信息。

以下是有关时间序列所含内容的一些详细信息:

  • points 数组包含带有时间戳的测量结果。

    以下是包含两个值的 points 数组示例:

      "points": [
        {
          "interval": {
            "startTime": "2020-07-27T20:20:21.597143Z",
            "endTime": "2020-07-27T20:20:21.597143Z"
          },
          "value": {
            "doubleValue": 0.473005
          }
        },
        {
          "interval": {
            "startTime": "2020-07-27T20:19:21.597239Z",
            "endTime": "2020-07-27T20:19:21.597239Z"
          },
          "value": {
            "doubleValue": 0.473025
          }
        },
      ],
    

    如需了解值的含义,您需要参考时间序列中包含的其他数据以及这些数据的定义。

  • resource 字段描述了受监控的硬件或软件组件。在 Cloud Monitoring 中,硬件或软件组件称为受监控的资源。受监控资源的示例包括 Compute Engine 实例和 App Engine 应用。如需查看受监控资源的列表,请参阅受监控资源列表

    以下是 resource 字段的示例:

      "resource": {
        "type": "gce_instance",
        "labels": {
          "instance_id": "2708613220420473591",
          "zone": "us-east1-b",
          "project_id": "sampleproject"
        }
      }
    
    • type 字段将受监控资源列为 gce_instance,这表示这些测量是在 Compute Engine 虚拟机实例上进行的。

    • labels 字段包含键值对,用于提供受监控资源的其他信息。对于 gce_instance 类型,这些标签标识了受监控的虚拟机实例。

  • metric 字段描述了要测量的内容。

    以下是 metric 字段的示例:

      "metric": {
        "labels": {
          "instance_name": "test"
        },
        "type": "compute.googleapis.com/instance/cpu/utilization"
      },
    
    • 对于 Trusted Cloud by S3NS 服务,type 字段指定服务和受监控的内容。在此示例中,Compute Engine 服务会测量 CPU 利用率。
  • metricKind 字段描述了时间序列中相邻测量之间的关系:

    • GAUGE 指标用于存储在给定时间测量的事物值,例如每小时温度记录。

    • CUMULATIVE 指标会存储给定时刻(例如车辆中的里程表)测量的事物累计值。

    • DELTA 指标会存储指定时间段内所测量事物值的变化,例如,显示股票收益或损失的股票摘要。

  • valueType 字段描述测量的数据类型:INT64DOUBLEBOOLSTRINGDISTRIBUTION

Cloud Monitoring 会针对资源和指标标签值的每个组合写入一个时序。您可以使用这些标签对时序进行分组和过滤。

后续步骤