Einige oder alle Informationen auf dieser Seite gelten möglicherweise nicht für Cloud de Confiance von S3NS. Weitere Informationen finden Sie unter Unterschiede zu Google Cloud.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Graph durchsuchen

In dieser Anleitung wird gezeigt, wie Sie eine semantische Suche in Ihren Grafdaten durchführen, indem Sie die autonome Einbettungsgenerierung und die Funktion AI.SEARCH verwenden.

Ziele

In dieser Anleitung werden die folgenden Aufgaben behandelt:

Tabellen erstellen, die Informationen zu Personen, Finanzkonten, Kontoinhabern und Kontoübertragungen enthalten.
Mit der autonomen Generierung von Einbettungen können Sie den Workflow für die Einbettungspflege vereinfachen.
Erstellen Sie ein Diagramm, in dem die Beziehungen zwischen den in Ihren Tabellen gespeicherten Daten definiert werden.
Mit der Funktion AI.SEARCH in Ihren Grafikknoten können Sie eine semantische Suche in Kontobeschreibungen durchführen.
Mit der Funktion AI.SEARCH an den Grafkanten können Sie eine semantische Suche in Notizen zum Kontoübertrag durchführen.

Kosten

In diesem Dokument verwenden Sie die folgenden kostenpflichtigen Komponenten von Cloud de Confiance by S3NS:

BigQuery: You incur costs for the data that you process in BigQuery.

Nach Abschluss der in diesem Dokument beschriebenen Aufgaben können Sie weitere Kosten vermeiden, indem Sie die erstellten Ressourcen löschen. Weitere Informationen finden Sie unter Bereinigen.

Hinweis

Console

In the Cloud de Confiance console, on the project selector page, select or create a Cloud de Confiance project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
- Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.
Note: If you don't plan to keep the resources that you create in this procedure, create a project instead of selecting an existing project. After you finish these steps, you can delete the project, removing all resources associated with the project.

Go to project selector
Verify that billing is enabled for your Cloud de Confiance project.
Enable the BigQuery API.
Roles required to enable APIs
To enable APIs, you need the serviceusage.services.enable permission. If you created the project, then you likely already have this permission through the Owner role (roles/owner). Otherwise, you can get this permission through the Service Usage Admin role (roles/serviceusage.serviceUsageAdmin). Learn how to grant roles.
Enable the API

Achten Sie darauf, dass Sie die folgenden Rollen für das Projekt haben: BigQuery-Datenbearbeiter, Project IAM Admin
Rollen prüfen
1. Rufen Sie in der Cloud de Confiance Console die Seite IAM auf.
  IAM aufrufen
2. Wählen Sie das Projekt aus.
3. Suchen Sie in der Spalte Hauptkonto nach allen Zeilen, in denen Sie oder eine Gruppe, zu der Sie gehören, angegeben sind. Fragen Sie Ihren Administrator, zu welchen Gruppen Sie gehören.
4. Prüfen Sie in allen Zeilen, in denen Sie angegeben oder enthalten sind, die Spalte Rolle, um zu sehen, ob die Liste der Rollen die erforderlichen Rollen enthält.
Rollen zuweisen
1. Rufen Sie in der Cloud de Confiance Console die Seite IAM auf.
  IAM aufrufen
2. Wählen Sie das Projekt aus.
3. Klicken Sie auf Zugriffsrechte erteilen.
4. Geben Sie im Feld Neue Hauptkonten Ihre Nutzer-ID ein. Bei einem Nutzer in einem Mitarbeiteridentitätspool ist dies in der Regel dessen Kennung. Weitere Informationen erhalten Sie unter Mitarbeiteridentitätspool-Nutzer in IAM-Richtlinien darstellen oder von Ihrem Administrator.
5. Klicken Sie auf Rolle auswählen und suchen Sie dann nach der Rolle.
6. Klicken Sie auf Weitere Rolle hinzufügen, wenn Sie weitere Rollen zuweisen möchten.
7. Klicken Sie auf Speichern.

gcloud

Installieren Sie die Google Cloud CLI.
Konfigurieren Sie die gcloud CLI für die Verwendung Ihrer föderierten Identität.

Weitere Informationen finden Sie unter Mit Ihrer föderierten Identität in der gcloud CLI anmelden.
Führen Sie den folgenden Befehl aus, um die gcloud CLI zu initialisieren:
```
gcloud init
```
Erstellen Sie ein Cloud de Confiance Projekt oder wählen Sie eines aus.
Rollen, die zum Auswählen oder Erstellen eines Projekts erforderlich sind
- Projekt auswählen: Für die Auswahl eines Projekts ist keine bestimmte IAM-Rolle erforderlich. Sie können jedes Projekt auswählen, für das Ihnen eine Rolle zugewiesen wurde.
- Projekt erstellen: Zum Erstellen eines Projekts benötigen Sie die Rolle „Projektersteller“ (roles/resourcemanager.projectCreator), die die Berechtigung resourcemanager.projects.create enthält. Weitere Informationen zum Zuweisen von Rollen
Hinweis: Wenn Sie die Ressourcen, die Sie in diesem Verfahren erstellen, nicht behalten möchten, erstellen Sie ein Projekt, anstatt ein vorhandenes Projekt auszuwählen. Wenn Sie fertig sind, können Sie das Projekt löschen und dadurch alle mit dem Projekt verknüpften Ressourcen entfernen.
- So erstellen Sie ein Cloud de Confiance Projekt:
```
gcloud projects create PROJECT_ID
```
  Ersetzen Sie PROJECT_ID durch einen Namen für das Cloud de Confiance Projekt, das Sie erstellen.
- Wählen Sie das von Ihnen erstellte Cloud de Confiance Projekt aus:
```
gcloud config set project PROJECT_ID
```
  Ersetzen Sie PROJECT_ID durch den Namen Ihres Projekts in Cloud de Confiance .
Prüfen Sie, ob die Abrechnung für Ihr Cloud de Confiance Projekt aktiviert ist.
Aktivieren Sie die BigQuery API:
Rollen, die zum Aktivieren von APIs erforderlich sind
Zum Aktivieren von APIs benötigen Sie die Berechtigung serviceusage.services.enable. Wenn Sie das Projekt erstellt haben, haben Sie diese Berechtigung wahrscheinlich bereits über die Rolle „Inhaber“ (roles/owner). Andernfalls können Sie diese Berechtigung über die Rolle „Service Usage-Administrator“ (roles/serviceusage.serviceUsageAdmin) erhalten. Informationen zum Zuweisen von Rollen
```
gcloud services enable bigquery.googleapis.com
```

Weisen Sie Ihrem Nutzerkonto Rollen zu. Führen Sie den folgenden Befehl für jede der folgenden IAM-Rollen einmal aus: roles/bigquery.dataEditor, roles/resourcemanager.projectIamAdmin
```
gcloud projects add-iam-policy-binding PROJECT_ID --member="user:USER_IDENTIFIER" --role=ROLE
```
Ersetzen Sie Folgendes:
- PROJECT_ID: Ihre Projekt-ID.
- USER_IDENTIFIER: Die Kennung für Ihr Nutzerkonto Konto. Beispiele finden Sie unter Mitarbeiterpoolnutzer in IAM-Richtlinien darstellen.
- ROLE: Die IAM-Rolle, die Sie Ihrem Nutzerkonto zuweisen.

Tabellen erstellen

Erstellen Sie ein Dataset, um die Tabellen und das Diagramm zu speichern, die Sie in den folgenden Beispielen erstellen. Mit der folgenden Abfrage wird ein Dataset mit dem Namen graph_search erstellt:

CREATE SCHEMA IF NOT EXISTS graph_search;

Die folgenden Tabellen enthalten Informationen zu Personen und Konten sowie zu den Beziehungen zwischen diesen Einheiten:

Person: Informationen zu Personen.
Account: Informationen zu Bankkonten.
PersonOwnAccount: Informationen dazu, wem welche Konten gehören.
AccountTransferAccount: Informationen zu Übertragungen zwischen Konten.

Führen Sie die folgenden CREATE TABLE-Anweisungen aus, um diese Tabellen zu erstellen:

CREATE OR REPLACE TABLE graph_search.Person (
  id               INT64,
  name             STRING,
  PRIMARY KEY (id) NOT ENFORCED
);

CREATE OR REPLACE TABLE graph_search.Account (
  id                    INT64,
  create_time           TIMESTAMP,
  is_blocked            BOOL,
  description           STRING,
  description_embedding STRUCT<result ARRAY<FLOAT64>, status STRING>
                          GENERATED ALWAYS AS (
                          AI.EMBED(description, model => 'embeddinggemma-300m')
                          ) STORED OPTIONS( asynchronous = TRUE ),
  PRIMARY KEY (id) NOT ENFORCED
);

CREATE OR REPLACE TABLE graph_search.PersonOwnAccount (
  id               INT64 NOT NULL,
  account_id       INT64 NOT NULL,
  create_time      TIMESTAMP,
  PRIMARY KEY (id, account_id) NOT ENFORCED,
  FOREIGN KEY (id) REFERENCES graph_search.Person(id) NOT ENFORCED,
  FOREIGN KEY (account_id) REFERENCES graph_search.Account(id) NOT ENFORCED
);

CREATE OR REPLACE TABLE graph_search.AccountTransferAccount (
  id               INT64 NOT NULL,
  to_id            INT64 NOT NULL,
  amount           FLOAT64,
  create_time      TIMESTAMP NOT NULL,
  order_number     STRING,
  notes            STRING,
  notes_embedding  STRUCT<result ARRAY<FLOAT64>, status STRING>
                     GENERATED ALWAYS AS (
                     AI.EMBED(notes, model => 'embeddinggemma-300m')
                     ) STORED OPTIONS( asynchronous = TRUE ),
  PRIMARY KEY (id, to_id, create_time) NOT ENFORCED,
  FOREIGN KEY (id) REFERENCES graph_search.Account(id) NOT ENFORCED,
  FOREIGN KEY (to_id) REFERENCES graph_search.Account(id) NOT ENFORCED
);

In den Tabellen Account und AccountTransferAccount wird die autonome Einbettungsgenerierung verwendet, um Einbettungen für die Spalten description und notes zu erstellen.

In dieser Anleitung verwenden wir das Modell embeddinggemma-300m, da es in BigQuery ausgeführt wird und sich gut für kurze Strings eignet. Für längere Strings, die 128 Tokens überschreiten, sollten Sie ein anderes Einbettungsmodell wie text-embedding-005 auswählen. Weitere Informationen finden Sie unter Einbettungsmodell auswählen.

Daten einfügen

Mit den folgenden Abfragen werden einige Beispieldaten in Ihre Tabellen eingefügt. Bei den INSERT-Anweisungen werden die Einbettungsspalten ausgelassen und von BigQuery automatisch ausgefüllt.

INSERT INTO graph_search.Account
  (id, create_time, is_blocked, description)
VALUES
  (7,"2020-01-10 06:22:20.222",false,"Fund for a refreshing tropical vacation"),
  (16,"2020-01-27 17:55:09.206",true,"Fund for a rainy day!"),
  (20,"2020-02-18 05:44:20.655",false,"Saving up for travel");

INSERT INTO graph_search.Person
  (id, name)
VALUES
  (1,"Alex"),
  (2,"Dana"),
  (3,"Lee");

INSERT INTO graph_search.AccountTransferAccount
  (id, to_id, amount, create_time, order_number, notes)
VALUES
  (7,16,300,"2020-08-29 15:28:58.647","304330008004315", "wedding present"),
  (7,16,100,"2020-10-04 16:55:05.342","304120005529714", "birthday gift"),
  (16,20,300,"2020-09-25 02:36:14.926","103650009791820", "for shared cost of dinner"),
  (20,7,500,"2020-10-04 16:55:05.342","304120005529714", "fees for tuition"),
  (20,16,200,"2020-10-17 03:59:40.247","302290001484851", "loved the lunch");

INSERT INTO graph_search.PersonOwnAccount
  (id, account_id, create_time)
VALUES
  (1,7,"2020-01-10 06:22:20.222"),
  (2,20,"2020-01-27 17:55:09.206"),
  (3,16,"2020-02-18 05:44:20.655");

Diagramm erstellen

In der folgenden Abfrage wird mit der Anweisung CREATE PROPERTY GRAPH ein Diagramm mit dem Namen FinGraph im Dataset graph_search erstellt. Die Tabellen Account und Person sind die Knotentabellen. Die Tabellen AccountTransferAccount und PersonOwnAccount sind die Kantentabellen, die Beziehungen zwischen den Knotentabellen darstellen.

CREATE OR REPLACE PROPERTY GRAPH graph_search.FinGraph
NODE TABLES (graph_search.Account, graph_search.Person)
EDGE TABLES (
  graph_search.PersonOwnAccount
    SOURCE KEY (id) REFERENCES Person (id)
    DESTINATION KEY (account_id) REFERENCES Account (id)
    LABEL Owns,
  graph_search.AccountTransferAccount
    SOURCE KEY (id) REFERENCES Account (id)
    DESTINATION KEY (to_id) REFERENCES Account (id)
    LABEL Transfers
);

Knoten suchen

Die folgenden Abfragen zeigen, wem Konten für private Reisen und Urlaube gehören. In der ersten Abfrage wird mit einer DECLARE-Anweisung eine Variable namens similar_account erstellt. Die Variable wird in der DEFAULT-Klausel mit einem Aufruf von AI.SEARCH initialisiert, der Konten findet, deren Beschreibungen accounts for leisure travel and vacation semantisch am ähnlichsten sind. In der Abfrage wird das Argument top_k im Aufruf von AI.SEARCH auf 2 festgelegt, um die Anzahl der Ergebnisse zu begrenzen. Die zweite Abfrage ist eine Graphabfrage, die den Namen des Kontoinhabers zusammen mit der Kontobeschreibung zurückgibt.

DECLARE similar_account DEFAULT ((
SELECT ARRAY_AGG(base.id)
FROM
  AI.SEARCH(
    (SELECT * FROM graph_search.Account WHERE description_embedding IS NOT NULL),
    'description',
    'accounts for leisure travel and vacation',
    top_k => 2)
));

GRAPH graph_search.FinGraph
MATCH (p:Person)-[:Owns]->(a:Account)
WHERE a.id IN UNNEST(similar_account)
RETURN p.name, a.description;

Das Ergebnis sieht etwa so aus:

+------+-----------------------------------------+
| name | description                             |
+------+-----------------------------------------+
| Dana | Saving up for travel                    |
| Alex | Fund for a refreshing tropical vacation |
+------+-----------------------------------------+

Entscheidende Vorteile der Google Suche

Die folgenden Abfragen zeigen, wer Kontoübertragungen im Zusammenhang mit Lebensmittelzahlungen vorgenommen hat. In der ersten Abfrage wird die Funktion AI.SEARCH verwendet, um eine Variable namens food_transfers zu füllen. Diese Variable enthält die Bestellnummer von Übertragungen, deren zugehörige Notiz semantisch am ähnlichsten zu food ist. In der Abfrage wird das Argument top_k im Aufruf von AI.SEARCH auf 2 festgelegt, um die Anzahl der Ergebnisse zu begrenzen. Die zweite Abfrage ist eine Graphabfrage, die den Namen des Kontoinhabers zusammen mit dem Übertragungsvermerk zurückgibt.

DECLARE food_transfers DEFAULT ((
SELECT ARRAY_AGG(base.order_number)
FROM
  AI.SEARCH(
    (SELECT * FROM graph_search.AccountTransferAccount WHERE notes_embedding IS NOT NULL),
    'notes',
    'food',
    top_k => 2)
));

GRAPH graph_search.FinGraph
MATCH (p:Person)-[:Owns]->(:Account)-[t:Transfers]->(:Account)
WHERE t.order_number IN UNNEST(food_transfers)
RETURN p.name, t.notes;

Das Ergebnis sieht etwa so aus:

+------+---------------------------+
| name | notes                     |
+------+---------------------------+
| Dana | loved the lunch           |
| Lee  | for shared cost of dinner |
+------+---------------------------+

Vektorindex erstellen

Vektorindexe reduzieren die Latenz und die Berechnungskosten Ihrer Suchanfragen. Die Tabellen in dieser Anleitung sind zu klein, um einen Vektorindex zu verwenden. Vektorindexe sind nützlich, wenn Ihre Tabellen groß sind, in der Regel mit Millionen von Zeilen. BigQuery bietet zwei Arten von Indexen: IVF und TreeAH. Weitere Informationen zum Erstellen eines Index und zum Auswählen eines Typs finden Sie unter Vektorindexe verwalten.

Bereinigen

Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, löschen Sie entweder das Projekt, das die Ressourcen enthält, oder Sie behalten das Projekt und löschen die einzelnen Ressourcen.

Projekt löschen

Achtung: Das Löschen von Projekten hat folgende Auswirkungen:

Alle Inhalte des Projekts werden gelöscht. Wenn Sie für die Aufgaben in diesem Dokument ein bereits bestehendes Projekt verwendet haben und dieses löschen, werden auch alle anderen im Rahmen des Projekts erstellten Daten gelöscht.
Benutzerdefinierte Projekt-IDs gehen verloren. Beim Erstellen dieses Projekts haben Sie möglicherweise eine benutzerdefinierte Projekt-ID erstellt, die Sie weiterhin verwenden möchten. Damit die URLs, die die Projekt-ID nutzen, zum Beispiel eine appspot.com-URL, erhalten bleiben, sollten Sie ausgewählte Ressourcen innerhalb des Projekts löschen, anstatt das gesamte Projekt.

Wenn Sie mehrere Architekturen, Anleitungen und Kurzanleitungen durcharbeiten möchten, können Sie die Überschreitung von Projektkontingenten verhindern, indem Sie Projekte wiederverwenden.

Cloud de Confiance -Projekt löschen:

gcloud projects delete PROJECT_ID