הפעלה מחדש או איפוס של מכונה ב-Compute Engine

במאמר הזה נסביר איך להפעיל מחדש מכונה ב-Compute Engine או לאפס אותה. מידע נוסף על ההשפעות של איפוס מכונה, ועל ההבדלים בין השהיה, עצירה או איפוס של מכונה זמין במאמר השהיה, עצירה או איפוס של מכונות ב-Compute Engine.

הפעלה מחדש או איפוס של מופע יכולים לעזור להבטיח ביצועים אופטימליים ויציבות, או לעזור לפתור בעיות כמו מערכת הפעלה (OS) של אורח שקפאה, איטית או קורסת. בהתאם למצב של מערכת ההפעלה של האורח במופע, מבצעים אחת מהפעולות הבאות:

  • מפעילים מחדש את המכונה. אם מערכת ההפעלה של האורח פועלת לאט או קופאת, הפעלה מחדש תיתן לה מספיק זמן לסיים את הפעלת המשימות לפני הכיבוי.

  • מאפסים את המכונה. אפשר לאפס מכונה רק אם מערכת ההפעלה של האורח קרסה או לא מגיבה, ואין לכם אפשרויות אחרות. איפוס של מופע לא מאפשר למערכת ההפעלה של האורח להיסגר בצורה נקייה. הפעולה הזו עלולה לגרום למחיקה של נתונים שלא נשמרו ולפגוע במערכות הקבצים של הדיסקים.

לפני שמתחילים

התפקידים הנדרשים

כדי לקבל את ההרשאות שנדרשות לאיפוס או להפעלה מחדש של מכונת Compute, צריך לבקש מהאדמין להקצות לכם ב-IAM את התפקיד Compute Instance Admin ‏ (v1) (roles/compute.instanceAdmin.v1) במכונה. כדי לקרוא הסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

זהו תפקיד מוגדר מראש עם ההרשאות שנדרשות לאיפוס או להפעלה מחדש של מכונת Compute. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:

ההרשאות הנדרשות

כדי לאפס או להפעיל מחדש מכונת וירטואלית, צריך את ההרשאות הבאות:

  • כדי לאפס מכונה: compute.instances.reset
  • כדי להפעיל מחדש מכונה מתוך מערכת ההפעלה שלה: compute.instances.setMetadata

יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.

מגבלות

אי אפשר לאפס מכונות G4 עם פחות מ-GPU אחד (GPU חלקי). מידע נוסף על סוגי מכונות G4 עם יחידות GPU חלקיות (vGPU) זמין בסקירה הכללית של סדרת מכונות G4.

הפעלה מחדש של מכונה

הפעלה מחדש של מכונת חישוב מאפשרת למערכת ההפעלה של האורח במכונה לסיים את הפעלת המשימות לפני ש-Compute Engine שולח את אות הכיבוי של ACPI. כך אפשר להבטיח כיבוי נקי של מערכת ההפעלה של האורח.

הפעלה מחדש של מכונה מוחקת את הזיכרון שבו המכונה השתמשה. אם אתם משתמשים בדיסקים של RAM עם המכונות שלכם ואתם צריכים לשמור את הנתונים האלה, גבו את הנתונים לפני שתפעילו מחדש את המכונה.

כדי להפעיל מחדש מופע, בוחרים באחת מהאפשרויות הבאות:

Linux

  1. אם עדיין לא עשיתם זאת, מתחברים למופע.

  2. כדי להפעיל מחדש את המופע, מריצים את הפקודה הבאה:

    sudo reboot
    

Windows

  1. אם עדיין לא עשיתם זאת, מתחברים למופע באמצעות אחת מהשיטות הבאות:

  2. כדי להפעיל מחדש את המופע, מריצים את הפקודה הבאה:

    shutdown /r /t 0
    
  3. אופציונלי: כדי לעקוב אחרי תהליך הכיבוי וההפעלה מחדש של המופע, מפעילים את התפריט של Windows Boot Manager.

איפוס מכונה

איפוס של מופע מוחק את כל הנתונים בזיכרון של המופע, כולל קבצים זמניים שמאוחסנים בדיסקים של RAM. הנתונים האלה יאבדו באופן סופי, ו-Compute Engine לא יוצר גיבויים לפני איפוס המכונה.

אפשר לאפס כמה מקרים בו-זמנית או מקרים בודדים. אם יש כמה מכונות, משתמשים במסוף Cloud de Confiance או ב-Google Cloud CLI (אם המכונות ממוקמות באותו אזור). לכל מופע בנפרד, בוחרים אחת מהאפשרויות הבאות:

המסוף

  1. נכנסים לדף VM instances במסוף Cloud de Confiance .

    כניסה לדף VM instances

  2. בוחרים את המופעים לאיפוס.

  3. לוחצים על איפוס ואז שוב על איפוס כדי לאשר.

gcloud

כדי לאפס מכונה אחת או יותר שפועלות באזור יחיד, משתמשים בפקודה gcloud compute instances reset:

gcloud compute instances reset INSTANCE_NAMES \
    --zone=ZONE

מחליפים את מה שכתוב בשדות הבאים:

  • INSTANCE_NAMES: רשימה מופרדת ברווחים של שמות של מופעים – לדוגמה, instance-01 instance-02 instance-03.

  • ZONE: האזור שבו נמצאים המופעים.

המשך

import (
	"context"
	"fmt"
	"io"

	compute "cloud.google.com/go/compute/apiv1"
	computepb "cloud.google.com/go/compute/apiv1/computepb"
)

// resetInstance resets a running Google Compute Engine instance (with unencrypted disks).
func resetInstance(w io.Writer, projectID, zone, instanceName string) error {
	// projectID := "your_project_id"
	// zone := "europe-central2-b"
	// instanceName := "your_instance_name"

	ctx := context.Background()
	instancesClient, err := compute.NewInstancesRESTClient(ctx)
	if err != nil {
		return fmt.Errorf("NewInstancesRESTClient: %w", err)
	}
	defer instancesClient.Close()

	req := &computepb.ResetInstanceRequest{
		Project:  projectID,
		Zone:     zone,
		Instance: instanceName,
	}

	op, err := instancesClient.Reset(ctx, req)
	if err != nil {
		return fmt.Errorf("unable to reset instance: %w", err)
	}

	if err = op.Wait(ctx); err != nil {
		return fmt.Errorf("unable to wait for the operation: %w", err)
	}

	fmt.Fprintf(w, "Instance reset\n")

	return nil
}

Java


import com.google.api.gax.longrunning.OperationFuture;
import com.google.cloud.compute.v1.InstancesClient;
import com.google.cloud.compute.v1.Operation;
import com.google.cloud.compute.v1.Operation.Status;
import com.google.cloud.compute.v1.ResetInstanceRequest;
import java.io.IOException;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.TimeoutException;

public class ResetInstance {

  public static void main(String[] args)
      throws IOException, ExecutionException, InterruptedException, TimeoutException {
    // TODO(developer): Replace these variables before running the sample.
    /* project: project ID or project number of the Cloud project your instance belongs to.
       zone: name of the zone your instance belongs to.
       instanceName: name of the instance your want to reset.
     */
    String project = "your-project-id";
    String zone = "zone-name";
    String instanceName = "instance-name";

    resetInstance(project, zone, instanceName);
  }

  // Resets a running Google Compute Engine instance (with unencrypted disks).
  public static void resetInstance(String project, String zone, String instanceName)
      throws IOException, ExecutionException, InterruptedException, TimeoutException {
    /* Initialize client that will be used to send requests. This client only needs to be created
       once, and can be reused for multiple requests. After completing all of your requests, call
       the `instancesClient.close()` method on the client to safely
       clean up any remaining background resources. */
    try (InstancesClient instancesClient = InstancesClient.create()) {

      ResetInstanceRequest resetInstanceRequest = ResetInstanceRequest.newBuilder()
          .setProject(project)
          .setZone(zone)
          .setInstance(instanceName)
          .build();

      OperationFuture<Operation, Operation> operation = instancesClient.resetAsync(
          resetInstanceRequest);
      Operation response = operation.get(3, TimeUnit.MINUTES);

      if (response.getStatus() == Status.DONE) {
        System.out.println("Instance reset successfully ! ");
      }
    }
  }

}

Node.js

/**
 * TODO(developer): Uncomment and replace these variables before running the sample.
 */
// const projectId = 'YOUR_PROJECT_ID';
// const zone = 'europe-central2-b'
// const instanceName = 'YOUR_INSTANCE_NAME'

const compute = require('@google-cloud/compute');

async function resetInstance() {
  const instancesClient = new compute.InstancesClient();

  const [response] = await instancesClient.reset({
    project: projectId,
    zone,
    instance: instanceName,
  });
  let operation = response.latestResponse;
  const operationsClient = new compute.ZoneOperationsClient();

  // Wait for the operation to complete.
  while (operation.status !== 'DONE') {
    [operation] = await operationsClient.wait({
      operation: operation.name,
      project: projectId,
      zone: operation.zone.split('/').pop(),
    });
  }

  console.log('Instance reset.');
}

resetInstance();

PHP

use Google\Cloud\Compute\V1\Client\InstancesClient;
use Google\Cloud\Compute\V1\ResetInstanceRequest;

/**
 * Reset a running Google Compute Engine instance (with unencrypted disks).
 *
 * @param string $projectId Project ID or project number of the Cloud project your instance belongs to.
 * @param string $zone Name of the zone your instance belongs to.
 * @param string $instanceName Name of the instance you want to reset.
  *
 * @throws \Google\ApiCore\ApiException if the remote call fails.
 * @throws \Google\ApiCore\ValidationException if local error occurs before remote call.
 */
function reset_instance(
    string $projectId,
    string $zone,
    string $instanceName
) {
    // Stop the Compute Engine instance using InstancesClient.
    $instancesClient = new InstancesClient();
    $request = (new ResetInstanceRequest())
        ->setInstance($instanceName)
        ->setProject($projectId)
        ->setZone($zone);
    $operation = $instancesClient->reset($request);

    // Wait for the operation to complete.
    $operation->pollUntilComplete();
    if ($operation->operationSucceeded()) {
        printf('Instance %s reset successfully' . PHP_EOL, $instanceName);
    } else {
        $error = $operation->getError();
        printf('Failed to reset instance: %s' . PHP_EOL, $error?->getMessage());
    }
}

Python

from __future__ import annotations

import sys
from typing import Any

from google.api_core.extended_operation import ExtendedOperation
from google.cloud import compute_v1


def wait_for_extended_operation(
    operation: ExtendedOperation, verbose_name: str = "operation", timeout: int = 300
) -> Any:
    """
    Waits for the extended (long-running) operation to complete.

    If the operation is successful, it will return its result.
    If the operation ends with an error, an exception will be raised.
    If there were any warnings during the execution of the operation
    they will be printed to sys.stderr.

    Args:
        operation: a long-running operation you want to wait on.
        verbose_name: (optional) a more verbose name of the operation,
            used only during error and warning reporting.
        timeout: how long (in seconds) to wait for operation to finish.
            If None, wait indefinitely.

    Returns:
        Whatever the operation.result() returns.

    Raises:
        This method will raise the exception received from `operation.exception()`
        or RuntimeError if there is no exception set, but there is an `error_code`
        set for the `operation`.

        In case of an operation taking longer than `timeout` seconds to complete,
        a `concurrent.futures.TimeoutError` will be raised.
    """
    result = operation.result(timeout=timeout)

    if operation.error_code:
        print(
            f"Error during {verbose_name}: [Code: {operation.error_code}]: {operation.error_message}",
            file=sys.stderr,
            flush=True,
        )
        print(f"Operation ID: {operation.name}", file=sys.stderr, flush=True)
        raise operation.exception() or RuntimeError(operation.error_message)

    if operation.warnings:
        print(f"Warnings during {verbose_name}:\n", file=sys.stderr, flush=True)
        for warning in operation.warnings:
            print(f" - {warning.code}: {warning.message}", file=sys.stderr, flush=True)

    return result


def reset_instance(project_id: str, zone: str, instance_name: str) -> None:
    """
    Resets a stopped Google Compute Engine instance (with unencrypted disks).
    Args:
        project_id: project ID or project number of the Cloud project your instance belongs to.
        zone: name of the zone your instance belongs to.
        instance_name: name of the instance your want to reset.
    """
    instance_client = compute_v1.InstancesClient()

    operation = instance_client.reset(
        project=project_id, zone=zone, instance=instance_name
    )

    wait_for_extended_operation(operation, "instance reset")

REST

כדי לאפס מכונה פעילה, שולחים בקשת POST אל ה-method‏ instances.reset:

 POST https://compute.s3nsapis.fr//compute/v1/projects/PROJECT_ID/zones/ZONE/instances/INSTANCE_NAME/reset

מחליפים את מה שכתוב בשדות הבאים:

  • INSTANCE_NAME: השם של המכונה.

  • PROJECT_ID: מזהה הפרויקט שבו נמצא המופע.

  • ZONE: האזור שבו נמצאת המכונה.

המאמרים הבאים