Einführung in materialisierte Ansichten
Materialisierte Ansichten sind vorausberechnete Ansichten, in denen die Ergebnisse einer SQL-Abfrage regelmäßig gespeichert werden. In einigen Anwendungsfällen können mit materialisierten Ansichten die gesamte Verarbeitungszeit und die damit verbundenen Kosten reduziert werden, da für jede Abfrage weniger Daten gescannt werden müssen. Sie können materialisierte Ansichten wie andere Datenressourcen abfragen.
In den folgenden Anwendungsfällen wird der Wert von materialisierten Ansichten erläutert:
- Daten vorverarbeiten: Sie können die Abfrageleistung verbessern, indem Sie Aggregate, Filter, Joins und Cluster vorbereiten.
- Dashboard-Beschleunigung BI-Tools wie Looker, die häufig dieselben aggregierten Messwerte abfragen, z. B. täglich aktive Nutzer, werden unterstützt.
- Echtzeitanalysen für große Streams: Schnellere Antworten auf Tabellen mit Streamingdaten mit hoher Geschwindigkeit möglich
- Kostenverwaltung Kosten für wiederholte, teure Abfragen großer Datasets senken
Materialisierte Ansichten haben folgende Hauptmerkmale:
- Keinerlei Wartung erforderlich: Materialisierte Ansichten werden im Hintergrund vorberechnet, wenn sich die Basistabellen ändern. Alle inkrementellen Datenänderungen aus den Basistabellen werden automatisch zu den materialisierten Ansichten hinzugefügt, ohne dass der Nutzer eingreifen müssen.
- Aktuelle Daten: Materialisierte Ansichten geben aktuelle Daten zurück. Wenn Änderungen an Basistabellen die materialisierte Ansicht ungültig machen, werden Daten direkt aus den Basistabellen gelesen. Wenn die Änderungen an den Basistabellen die materialisierte Ansicht nicht entwerten, werden die restlichen Daten aus der materialisierten Ansicht und nur die Änderungen aus den Basistabellen gelesen.
- Intelligente Feinabstimmung. Wenn ein Teil einer Abfrage gegen eine Basistabelle durch die Abfrage der materialisierten Ansicht gelöst werden kann, leitet BigQuery die Abfrage um, um die materialisierte Ansicht für eine bessere Leistung und Effizienz zu verwenden. Informationen dazu, wie und wann die intelligente Feinabstimmung Abfragen verbessern kann, finden Sie unter Materialisierte Ansichten verwenden.
Inkrementelle und nicht inkrementelle materialisierte Ansichten
Es gibt zwei grundlegende Arten von materialisierten Ansichten:
- Inkrementelle materialisierte Ansichten unterstützen nur eine begrenzte Anzahl von Funktionen. Weitere Informationen zur unterstützten SQL-Syntax für materialisierte Ansichten finden Sie unter Materialisierte Ansichten erstellen. Nur inkrementelle materialisierte Ansichten können von der intelligenten Abstimmung profitieren.
- Nicht inkrementelle Funktionen unterstützen die meisten Syntaxen, die von inkrementellen materialisierten Ansichten nicht unterstützt werden.
Wenn Sie materialisierte Ansichten erstellen, können Sie in BigQuery standardmäßig nur Ansichten auf Grundlage von inkrementellen Abfragen erstellen. Wenn Sie eine nicht inkrementelle Ansicht erstellen möchten, können Sie allow_non_incremental_definition = true in der Definition der materialisierten Ansicht angeben.
Welche Art von materialisierter Ansicht am besten geeignet ist, hängt von Ihrer Situation ab. In der folgenden Tabelle werden die Funktionen von inkrementellen und nicht inkrementellen materialisierten Ansichten verglichen:
| Kategorie | Inkrementell | Nicht inkrementell |
|---|---|---|
| Abfrage wird unterstützt | Begrenzt | Die meisten Anfragen |
| Wartung | Die Kosten für häufig verwendete Abfragen können gesenkt werden. Informationen zum Aktualisieren materialisierter Ansichten finden Sie unter Inkrementelle Aktualisierungen. | Bei jeder Aktualisierung wird die vollständige Abfrage ausgeführt. |
| Unterstützung für die intelligente Feinabstimmung | Wird für die meisten Ansichtsabfragen unterstützt. | Nein |
| Immer aktuelle Ergebnisse | Unterstützt. Inkrementelle Ansichten geben aktuelle Abfrageergebnisse zurück, auch wenn sich die Basistabellen seit der letzten Aktualisierung geändert haben. | Nein |
Autorisierte materialisierte Ansichten
Sie können eine autorisierte materialisierte Ansicht erstellen, um eine Teilmenge von Daten aus einem Quelldataset für eine Ansicht in einem sekundären Dataset freizugeben. Anschließend können Sie diese Ansicht für bestimmte Nutzer und Gruppen (Hauptkonten) freigeben, die die freigegebenen Daten sehen können. Nutzer können die Daten abfragen, die Sie in einer Ansicht bereitstellen, aber nicht direkt auf das Quelldataset zugreifen.
Autorisierte Ansichten und autorisierte materialisierte Ansichten werden auf dieselbe Weise autorisiert. Weitere Informationen finden Sie unter Autorisierte Ansichten.
Interaktion mit anderen BigQuery-Features
Die folgenden BigQuery-Features funktionieren transparent mit materialisierten Ansichten:
Erklärung durch Abfrageplan: Der Abfrageplan gibt an, welche materialisierten Ansichten gescannt wurden (sofern vorhanden) und wie viele Bytes aus der materialisierten Ansicht und den Basistabellen insgesamt gelesen werden.
Abfrage-Caching: Die Ergebnisse einer Abfrage, die von BigQuery mit einer materialisierten Ansicht neu geschrieben werden, können im Rahmen der üblichen Beschränkungen (Verwendung deterministischer Funktionen, kein Streaming in die Basistabellen usw.) im Cache gespeichert werden.
Kosteneinschränkung:Wenn Sie einen Wert für die maximal in Rechnung gestellten Byte festgelegt haben und eine Abfrage eine Anzahl von Byte über das Limit hinaus lesen würde, schlägt die Abfrage fehl, kostenlos zu verursachen. Dies ist unabhängig davon, ob die Abfrage materialisierte Ansichten, die Basistabellen oder beides verwendet.
Kostenschätzung mit Probelauf: Bei einem Probelauf wird die Logik für das Neuschreiben der Abfrage anhand der verfügbaren materialisierten Ansichten wiederholt und eine Kostenschätzung bereitgestellt. Mit dieser Funktion können Sie testen, ob eine bestimmte Abfrage materialisierte Ansichten verwendet.
Regionenübergreifende Datenreplikation:Materialisierte Ansichten können für BigQuery-Tabellen erstellt werden, für die die regionenübergreifende Replikation aktiviert ist, jedoch nur in der primären Region. Wenn die sekundäre Region verwendet wird, kann die folgende Fehlermeldung angezeigt werden:
The dataset replica of the cross region dataset {PROJECT}:{DATASET} in region {REGION} is read-only because it's not the primary replica.
Preise für materialisierte Ansichten
Kosten fallen im Zusammenhang mit den folgenden Aspekten von materialisierten Ansichten an:
- Abfragen von materialisierten Ansichten.
- Pflegen von materialisierten Ansichten, z. B. wann materialisierte Ansichten aktualisiert werden. Die Kosten für die automatische Aktualisierung werden dem Projekt in Rechnung gestellt, in dem sich die Ansicht befindet. Die Kosten für die manuelle Aktualisierung werden dem Projekt in Rechnung gestellt, in dem der manuelle Aktualisierungsjob ausgeführt wird. Weitere Informationen zur Kostenkontrolle für Wartungen finden Sie unter Jobwartung aktualisieren.
- Speichern von Tabellen materialisierter Ansichten.
| Komponente | On-Demand-Preise | Kapazitätsbasierte Preise |
|---|---|---|
| Abfragen | Byte, die von materialisierten Ansichten verarbeitet werden, und alle erforderlichen Teile der Basistabellen.1 | Slots werden während der Abfrage verbraucht. |
| Wartung | Während der Aktualisierung verarbeitete Byte. | Slots werden während der Aktualisierung benötigt. |
| Speicher | In materialisierten Ansichten gespeicherte Byte. | In materialisierten Ansichten gespeicherte Byte. |
1 Nach Möglichkeit liest BigQuery nur die Änderungen seit der letzten Aktualisierung der Ansicht. Weitere Informationen finden Sie unter Inkrementelle Aktualisierungen.
Details zu den Speicherkosten
Bei aggregierten Werten des Typs AVG, ARRAY_AGG und APPROX_COUNT_DISTINCT in einer materialisierten Ansicht wird der endgültige Wert nicht direkt gespeichert. BigQuery speichert stattdessen intern eine materialisierte Ansicht als Zwischenskizze. Diese wird verwendet, um den endgültigen Wert zu generieren.
Sehen Sie sich als Beispiel eine materialisierte Ansicht an, die mit dem folgenden Befehl erstellt wurde:
CREATE MATERIALIZED VIEW project-id.my_dataset.my_mv_table AS SELECT date, AVG(net_paid) AS avg_paid FROM project-id.my_dataset.my_base_table GROUP BY date
Während die Spalte avg_paid für den Nutzer als NUMERIC oder FLOAT64 gerendert wird, wird sie intern als BYTES gespeichert. Der Inhalt ist dabei eine Zwischenskizze in einem proprietären Format. Für die Berechnung der Datengröße wird die Spalte als BYTES behandelt.