Sebagian atau seluruh informasi di halaman ini mungkin tidak berlaku untuk Cloud de Confiance dari S3NS. Lihat Perbedaan dengan Google Cloud untuk mengetahui detail selengkapnya.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Tabel terkelola Apache Iceberg

Tabel terkelola Apache Iceberg (sebelumnya tabel BigLake untuk Apache Iceberg di BigQuery) memberikan fondasi untuk membangun lakehouse berformat terbuka di Cloud de Confiance by S3NS. Tabel yang dikelola Iceberg menawarkan pengalaman terkelola sepenuhnya yang sama seperti tabel BigQuery standar, tetapi menyimpan data di bucket penyimpanan milik pelanggan. Tabel terkelola Iceberg mendukung format tabel Iceberg terbuka untuk interoperabilitas yang lebih baik dengan mesin komputasi open source dan pihak ketiga pada satu salinan data.

Tabel terkelola Iceberg mendukung fitur berikut:

Mutasi tabel menggunakan bahasa pengolahan data (DML) GoogleSQL.
Streaming batch dan throughput tinggi terpadu menggunakan BigQuery Storage Write API melalui konektor seperti Spark, Dataflow, dan mesin lainnya.
Ekspor snapshot Iceberg V2 dan refresh otomatis pada setiap mutasi tabel untuk akses kueri langsung dengan mesin kueri open source dan pihak ketiga, seperti Spark.
Evolusi skema, yang memungkinkan Anda menambahkan, menghapus, dan mengganti nama kolom agar sesuai dengan kebutuhan Anda. Fitur ini juga memungkinkan Anda mengubah jenis data dan mode kolom yang ada. Untuk mengetahui informasi selengkapnya, lihat Aturan konversi.
Pengoptimalan penyimpanan otomatis, termasuk penentuan ukuran file adaptif, pengelompokan otomatis, pembersihan sampah memori, dan pengoptimalan metadata.
Perjalanan waktu untuk akses data historis di BigQuery.
Keamanan tingkat kolom dan penyamaran data.
Transaksi multi-pernyataan.
Partisi tabel.
Pembuatan tabel dalam alur kerja Dataform.
Runtime lanjutan BigQuery.

Arsitektur

Tabel terkelola Iceberg menghadirkan kemudahan pengelolaan resource BigQuery untuk tabel yang berada di bucket cloud Anda sendiri. Anda dapat menggunakan BigQuery dan mesin komputasi open source di tabel ini tanpa memindahkan data dari bucket yang Anda kontrol. Anda harus mengonfigurasi bucket Cloud Storage sebelum mulai menggunakan tabel terkelola Iceberg.

Penggunaan tabel terkelola Iceberg memiliki implikasi berikut pada bucket Anda:

BigQuery membuat file data baru di bucket sebagai respons terhadap permintaan penulisan dan pengoptimalan penyimpanan di latar belakang, seperti pernyataan DML dan streaming.
Pemadatan dan pengelompokan otomatis dilakukan pada file data di bucket. Setelah masa berlaku periode perjalanan waktu berakhir, file data akan dikumpulkan sampah. Namun, jika tabel dihapus, file data terkait tidak akan dikumpulkan sampah. Untuk mengetahui informasi selengkapnya, lihat Pengoptimalan penyimpanan.

Membuat tabel terkelola Iceberg mirip dengan membuat tabel BigQuery. Karena menyimpan data dalam format terbuka di Cloud Storage, Anda harus melakukan hal berikut:

Tentukan koneksi resource Cloud dengan WITH CONNECTION untuk mengonfigurasi kredensial koneksi agar BigQuery dapat mengakses Cloud Storage.
Tentukan format file penyimpanan data sebagai PARQUET dengan pernyataan file_format = PARQUET.
Tentukan format tabel metadata open source sebagai ICEBERG dengan pernyataan table_format = ICEBERG.

Praktik terbaik

Mengubah atau menambahkan file secara langsung ke bucket di luar BigQuery dapat menyebabkan hilangnya data atau error yang tidak dapat dipulihkan. Tabel berikut menjelaskan kemungkinan skenario:

Operasi	Konsekuensi	Pencegahan
Tambahkan file baru ke bucket di luar BigQuery.	Kehilangan data: File atau objek baru yang ditambahkan di luar BigQuery tidak dilacak oleh BigQuery. File yang tidak dilacak akan dihapus oleh proses pengumpulan sampah di latar belakang.	Menambahkan data secara eksklusif melalui BigQuery. Hal ini memungkinkan BigQuery melacak file dan mencegahnya dikumpulkan sampah. Untuk mencegah penambahan yang tidak disengaja dan kehilangan data, sebaiknya batasi izin tulis alat eksternal pada bucket yang berisi tabel terkelola Iceberg.
Buat tabel terkelola Iceberg baru dalam awalan yang tidak kosong.	Kehilangan data: Data yang ada tidak dilacak oleh BigQuery, sehingga file ini dianggap tidak dilacak, dan dihapus oleh proses pengumpulan sampah di latar belakang.	Buat hanya tabel terkelola Iceberg baru di awalan kosong.
Ubah atau ganti file data tabel yang dikelola Iceberg.	Kehilangan data: Saat modifikasi atau penggantian eksternal, tabel gagal dalam pemeriksaan konsistensi dan menjadi tidak dapat dibaca. Kueri terhadap tabel gagal. Tidak ada cara layanan mandiri untuk memulihkan dari titik ini. Hubungi dukungan untuk mendapatkan bantuan pemulihan data.	Ubah data secara eksklusif melalui BigQuery. Hal ini memungkinkan BigQuery melacak file dan mencegahnya dikumpulkan sampah. Untuk mencegah penambahan yang tidak disengaja dan kehilangan data, sebaiknya batasi izin tulis alat eksternal pada bucket yang berisi tabel terkelola Iceberg.
Buat dua tabel terkelola Iceberg di URI yang sama atau tumpang-tindih.	Kehilangan data: BigQuery tidak menjembatani instance URI identik dari tabel yang dikelola Iceberg. Proses pengumpulan sampah di latar belakang untuk setiap tabel akan menganggap file tabel yang berlawanan sebagai tidak terlacak, dan menghapusnya, sehingga menyebabkan kehilangan data.	Gunakan URI unik untuk setiap tabel yang dikelola Iceberg.

Praktik terbaik konfigurasi bucket Cloud Storage

Konfigurasi bucket Cloud Storage dan koneksinya dengan BigQuery memiliki dampak langsung pada performa, biaya, integritas data, keamanan, dan tata kelola tabel yang dikelola Iceberg. Berikut adalah praktik terbaik untuk membantu konfigurasi ini:

Pilih nama yang dengan jelas menunjukkan bahwa bucket hanya ditujukan untuk tabel yang dikelola Iceberg.
Pilih bucket Cloud Storage satu region yang ditempatkan bersama di region yang sama dengan set data BigQuery Anda. Koordinasi ini meningkatkan performa dan menurunkan biaya dengan menghindari biaya transfer data.
Secara default, Cloud Storage menyimpan data di class penyimpanan Standard, yang memberikan performa yang memadai. Untuk mengoptimalkan biaya penyimpanan data, Anda dapat mengaktifkan Autoclass untuk mengelola transisi kelas penyimpanan secara otomatis. Autoclass dimulai dengan kelas penyimpanan Standard dan memindahkan objek yang tidak diakses ke kelas yang semakin jarang diakses untuk mengurangi biaya penyimpanan. Saat objek dibaca lagi, objek tersebut akan dipindahkan kembali ke kelas Standard.
Aktifkan akses level bucket yang seragam dan pencegahan akses publik.
Pastikan peran yang diperlukan ditetapkan kepada pengguna dan akun layanan yang benar.
Untuk mencegah penghapusan atau kerusakan data yang tidak disengaja di bucket Cloud Storage, batasi izin penulisan dan penghapusan untuk sebagian besar pengguna di organisasi Anda. Anda dapat melakukannya dengan menetapkan kebijakan izin bucket dengan kondisi yang menolak permintaan PUT dan DELETE untuk semua pengguna, kecuali pengguna yang Anda tentukan.
Terapkan kunci enkripsi yang dikelola Google atau yang dikelola pelanggan untuk perlindungan ekstra data sensitif.
Aktifkan logging audit untuk transparansi operasional, pemecahan masalah, dan pemantauan akses data.
Pertahankan kebijakan penghapusan sementara default (retensi 7 hari) untuk melindungi dari penghapusan yang tidak disengaja. Namun, jika Anda menemukan bahwa data telah dihapus, hubungi dukungan, bukan memulihkan objek secara manual, karena objek yang ditambahkan atau diubah di luar BigQuery tidak dilacak oleh metadata BigQuery.
Penentuan ukuran file adaptif, pengelompokan otomatis, dan pengumpulan sampah diaktifkan secara otomatis dan membantu mengoptimalkan performa dan biaya file.
Hindari fitur Cloud Storage berikut, karena tidak didukung untuk tabel terkelola Iceberg:
- Namespace hierarkis
- Daftar kontrol akses (ACL) objek
- Kunci enkripsi yang disediakan pelanggan
- Pembuatan versi objek
- Kunci objek
- Kunci bucket
- Memulihkan objek yang dihapus sementara dengan BigQuery API atau bq CLI

Anda dapat menerapkan praktik terbaik ini dengan membuat bucket menggunakan perintah berikut:

gcloud storage buckets create gs://BUCKET_NAME \
    --project=PROJECT_ID \
    --location=LOCATION \
    --enable-autoclass \
    --public-access-prevention \
    --uniform-bucket-level-access

Ganti kode berikut:

BUCKET_NAME: nama untuk bucket baru Anda
PROJECT_ID: ID project Anda
LOCATION: lokasi untuk bucket baru Anda

Alur kerja tabel terkelola Iceberg

Bagian berikut menjelaskan cara membuat, memuat, mengelola, dan membuat kueri tabel terkelola Iceberg.

Sebelum memulai

Sebelum membuat dan menggunakan tabel terkelola Iceberg, pastikan Anda telah menyiapkan koneksi resource Cloud ke bucket penyimpanan. Koneksi Anda memerlukan izin tulis di bucket penyimpanan, seperti yang ditentukan di bagian Peran yang diperlukan berikut. Untuk mengetahui informasi selengkapnya tentang peran dan izin yang diperlukan untuk koneksi, lihat Mengelola koneksi.

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan agar BigQuery dapat mengelola tabel di project Anda, minta administrator Anda untuk memberi Anda peran IAM berikut:

Untuk membuat tabel terkelola Iceberg:
- BigQuery Data Owner (roles/bigquery.dataOwner) di project Anda
- BigQuery Connection Admin (roles/bigquery.connectionAdmin) di project Anda
Untuk membuat kueri tabel terkelola Iceberg:
- BigQuery Data Viewer (roles/bigquery.dataViewer) di project Anda
- Pengguna BigQuery (roles/bigquery.user) di project Anda
Beri akun layanan koneksi peran berikut agar dapat membaca dan menulis data di Cloud Storage:
- Storage Object User (roles/storage.objectUser) di bucket
- Storage Legacy Bucket Reader (roles/storage.legacyBucketReader) di bucket

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk mengizinkan BigQuery mengelola tabel di project Anda. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan agar BigQuery dapat mengelola tabel di project Anda:

Semua:
- bigquery.connections.delegate di project Anda
- bigquery.jobs.create di project Anda
- bigquery.readsessions.create di project Anda
- bigquery.tables.create di project Anda
- bigquery.tables.get di project Anda
- bigquery.tables.getData di project Anda
- storage.buckets.get di bucket Anda
- storage.objects.create di bucket Anda
- storage.objects.delete di bucket Anda
- storage.objects.get di bucket Anda
- storage.objects.list di bucket Anda

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Membuat tabel terkelola Iceberg

Untuk membuat tabel terkelola Iceberg, pilih salah satu metode berikut:

SQL

CREATE TABLE [PROJECT_ID.]DATASET_ID.TABLE_NAME (
COLUMN DATA_TYPE[, ...]
)
CLUSTER BY CLUSTER_COLUMN_LIST
WITH CONNECTION {CONNECTION_NAME | DEFAULT}
OPTIONS (
file_format = 'PARQUET',
table_format = 'ICEBERG',
storage_uri = 'STORAGE_URI');

Ganti kode berikut:

PROJECT_ID: project yang berisi set data. Jika tidak ditentukan, perintah akan mengasumsikan project default.
DATASET_ID: set data yang sudah ada.
TABLE_NAME: nama tabel yang Anda buat.
DATA_TYPE: jenis data informasi yang ada dalam kolom.
CLUSTER_COLUMN_LIST (opsional): daftar yang dipisahkan koma yang berisi hingga empat kolom. Kolom tersebut harus berupa kolom tingkat atas yang tidak berulang.
CONNECTION_NAME: nama koneksi. Contoh, myproject.us.myconnection. Untuk menggunakan koneksi default, tentukan DEFAULT, bukan nama koneksi.
STORAGE_URI: URI Cloud Storage yang sepenuhnya memenuhi syarat. Contohnya, gs://mybucket/table.

bq

bq --project_id=PROJECT_ID mk \
    --table \
    --file_format=PARQUET \
    --table_format=ICEBERG \
    --connection_id=CONNECTION_NAME \
    --storage_uri=STORAGE_URI \
    --schema=COLUMN_NAME:DATA_TYPE[, ...] \
    --clustering_fields=CLUSTER_COLUMN_LIST \
    DATASET_ID.MANAGED_TABLE_NAME

Ganti kode berikut:

PROJECT_ID: project yang berisi set data. Jika tidak ditentukan, perintah akan mengasumsikan project default.
CONNECTION_NAME: nama koneksi. Contoh, myproject.us.myconnection.
STORAGE_URI: URI Cloud Storage yang sepenuhnya memenuhi syarat. Contohnya, gs://mybucket/table.
COLUMN_NAME: nama kolom.
DATA_TYPE: jenis data informasi yang ada di dalam kolom.
CLUSTER_COLUMN_LIST (opsional): daftar yang dipisahkan koma yang berisi hingga empat kolom. Kolom tersebut harus berupa kolom tingkat atas yang tidak berulang.
DATASET_ID: ID set data yang ada.
MANAGED_TABLE_NAME: nama tabel yang Anda buat.

API

Panggil metode tables.insert' dengan resource tabel yang ditentukan, mirip dengan berikut:

{
"tableReference": {
  "tableId": "TABLE_NAME"
},
"biglakeConfiguration": {
  "connectionId": "CONNECTION_NAME",
  "fileFormat": "PARQUET",
  "tableFormat": "ICEBERG",
  "storageUri": "STORAGE_URI"
},
"schema": {
  "fields": [
    {
      "name": "COLUMN_NAME",
      "type": "DATA_TYPE"
    }
    [, ...]
  ]
}
}

Ganti kode berikut:

TABLE_NAME: nama tabel yang Anda buat.
CONNECTION_NAME: nama koneksi. Contoh, myproject.us.myconnection.
STORAGE_URI: URI Cloud Storage yang sepenuhnya memenuhi syarat. Karakter pengganti juga didukung. Contoh, gs://mybucket/table.
COLUMN_NAME: nama kolom.
DATA_TYPE: jenis data informasi yang ada di dalam kolom.

Mengimpor data ke tabel yang dikelola Iceberg

Bagian berikut menjelaskan cara mengimpor data dari berbagai format tabel ke dalam tabel yang dikelola Iceberg.

Memuat data standar dari file datar

Tabel yang dikelola Iceberg menggunakan tugas pemuatan BigQuery untuk memuat file eksternal ke dalam tabel yang dikelola Iceberg. Jika Anda memiliki tabel terkelola Iceberg yang sudah ada, ikuti panduan CLI bq load atau panduan SQL LOAD untuk memuat data eksternal. Setelah memuat data, file Parquet baru akan ditulis ke folder STORAGE_URI/data.

Jika petunjuk sebelumnya digunakan tanpa tabel terkelola Iceberg yang ada, tabel BigQuery akan dibuat.

Lihat contoh khusus alat berikut untuk batch load ke dalam tabel yang dikelola Iceberg:

SQL

LOAD DATA INTO MANAGED_TABLE_NAME
FROM FILES (
uris=['STORAGE_URI'],
format='FILE_FORMAT');

Ganti kode berikut:

MANAGED_TABLE_NAME: nama tabel terkelola Iceberg yang ada.
STORAGE_URI: Cloud Storage URI yang sepenuhnya memenuhi syarat atau daftar URI yang dipisahkan koma. Karakter pengganti juga didukung. Contoh, gs://mybucket/table.
FILE_FORMAT: format tabel sumber. Untuk format yang didukung, lihat baris format di load_option_list.

bq

bq load \
  --source_format=FILE_FORMAT \
  MANAGED_TABLE \
  STORAGE_URI

Ganti kode berikut:

FILE_FORMAT: format tabel sumber. Untuk format yang didukung, lihat baris format di load_option_list.
MANAGED_TABLE_NAME: nama tabel terkelola Iceberg yang ada.
STORAGE_URI: Cloud Storage URI yang sepenuhnya memenuhi syarat atau daftar URI yang dipisahkan koma. Karakter pengganti juga didukung. Contoh, gs://mybucket/table.

Pemuatan standar dari file yang dipartisi Apache Hive

Anda dapat memuat file berpartisi Hive ke dalam tabel terkelola Iceberg menggunakan tugas pemuatan BigQuery standar. Untuk informasi selengkapnya, lihat Memuat data yang dipartisi secara eksternal.

Memuat data streaming dari Pub/Sub

Anda dapat memuat data streaming ke dalam tabel yang dikelola Iceberg menggunakan langganan Pub/Sub BigQuery.

Mengekspor data dari tabel terkelola Iceberg

Bagian berikut menjelaskan cara mengekspor data dari tabel yang dikelola Iceberg ke dalam berbagai format tabel.

Mengekspor data ke dalam format datar

Untuk mengekspor tabel terkelola Iceberg ke dalam format datar, gunakan pernyataan EXPORT DATA dan pilih format tujuan. Untuk mengetahui informasi selengkapnya, lihat Mengekspor data.

Membuat snapshot metadata tabel terkelola Iceberg

Untuk membuat snapshot metadata tabel yang dikelola Iceberg, ikuti langkah-langkah berikut:

Ekspor metadata ke dalam format Iceberg V2 dengan pernyataan SQL EXPORT TABLE METADATA.
Opsional: Jadwalkan refresh snapshot metadata Iceberg. Untuk memuat ulang snapshot metadata Iceberg berdasarkan interval waktu yang ditetapkan, gunakan kueri terjadwal.
Opsional: Aktifkan pemuatan ulang otomatis metadata untuk project Anda guna memperbarui snapshot metadata tabel Iceberg secara otomatis pada setiap mutasi tabel. Untuk mengaktifkan pemuatan ulang otomatis metadata, hubungi bigquery-tables-for-apache-iceberg-help@google.com. Biaya EXPORT METADATA akan diterapkan pada setiap operasi pemuatan ulang.

Contoh berikut membuat kueri terjadwal bernama My Scheduled Snapshot Refresh Query menggunakan pernyataan DDL EXPORT TABLE METADATA FROM mydataset.test. Pernyataan DDL berjalan setiap 24 jam.

bq query \
    --use_legacy_sql=false \
    --display_name='My Scheduled Snapshot Refresh Query' \
    --schedule='every 24 hours' \
    'EXPORT TABLE METADATA FROM mydataset.test'

Melihat snapshot metadata tabel terkelola Iceberg

Setelah memperbarui snapshot metadata tabel terkelola Iceberg, Anda dapat menemukan snapshot di URI Cloud Storage tempat tabel terkelola Iceberg dibuat pertama kali. Folder /data berisi shard data file Parquet, dan folder /metadata berisi snapshot metadata tabel yang dikelola Iceberg.

SELECT
  table_name,
  REGEXP_EXTRACT(ddl, r"storage_uri\s*=\s*\"([^\"]+)\"") AS storage_uri
FROM
  `mydataset`.INFORMATION_SCHEMA.TABLES;

Perhatikan bahwa mydataset dan table_name adalah placeholder untuk set data dan tabel Anda yang sebenarnya.

Membaca tabel terkelola Iceberg dengan Spark

Contoh berikut menyiapkan lingkungan Anda untuk menggunakan Spark SQL dengan Spark, lalu menjalankan kueri untuk mengambil data dari tabel terkelola Iceberg yang ditentukan.

spark-sql \
  --packages org.apache.iceberg:iceberg-spark-runtime-ICEBERG_VERSION_NUMBER \
  --conf spark.sql.catalog.CATALOG_NAME=org.apache.iceberg.spark.SparkCatalog \
  --conf spark.sql.catalog.CATALOG_NAME.type=hadoop \
  --conf spark.sql.catalog.CATALOG_NAME.warehouse='BUCKET_PATH' \

# Query the table
SELECT * FROM CATALOG_NAME.FOLDER_NAME;

Ganti kode berikut:

ICEBERG_VERSION_NUMBER: versi runtime saat ini. Download versi terbaru dari rilisan Iceberg.
CATALOG_NAME: katalog untuk mereferensikan tabel terkelola Iceberg Anda.
BUCKET_PATH: jalur ke bucket yang berisi file tabel. Contoh, gs://mybucket/.
FOLDER_NAME: folder yang berisi file tabel. Contoh, myfolder.

Mengubah tabel terkelola Iceberg

Untuk mengubah tabel yang dikelola Iceberg, ikuti langkah-langkah yang ditunjukkan dalam Mengubah skema tabel.

Menggunakan transaksi multi-pernyataan

Anda dapat menggunakan transaksi multi-pernyataan dengan tabel yang dikelola Iceberg dengan cara yang sama seperti yang Anda lakukan dengan tabel BigQuery standar. Transaksi multi-pernyataan biasanya digunakan untuk melakukan mutasi pada beberapa tabel secara bersamaan atau untuk melakukan mutasi pada satu tabel dalam beberapa tahap. Transaksi multi-pernyataan menjamin properti ACID dan mendukung snapshot isolation.

Batasan transaksi multi-pernyataan standar berlaku.

Menggunakan partisi

Anda dapat menggunakan partisi tabel dengan tabel terkelola Iceberg dengan cara yang sama seperti yang Anda lakukan dengan tabel BigQuery standar. Anda mempartisi tabel dengan menentukan kolom partisi, yang digunakan untuk menyegmentasi tabel. Jenis kolom berikut didukung untuk tabel terkelola Iceberg:

DATE
DATETIME
TIMESTAMP

Mempartisi tabel pada kolom DATE, DATETIME, atau TIMESTAMP dikenal sebagai partisi kolom unit waktu. Anda dapat memilih apakah partisi memiliki perincian per jam, harian, bulanan, atau tahunan.

Tabel terkelola Iceberg juga mendukung pengelompokan dan penggabungan tabel berpartisi dan yang dikelompokkan.

Batasan partisi

Semua batasan tabel berpartisi BigQuery berlaku.
Jenis kolom partisi selain DATE, DATETIME, atau TIMESTAMP tidak didukung.
Evolusi partisi tidak didukung.

Membuat tabel terkelola Iceberg berpartisi

Untuk membuat tabel terkelola Iceberg berpartisi, ikuti petunjuk untuk membuat tabel terkelola Iceberg standar, dan sertakan salah satu hal berikut, bergantung pada lingkungan Anda:

Klausul PARTITION BY
Flag --time_partitioning_field dan --time_partitioning_type
Properti timePartitioning

Anda dapat menetapkan dan memperbarui masa berlaku partisi dengan cara yang sama seperti yang Anda lakukan pada tabel BigQuery standar. Partisi yang masa berlakunya telah berakhir akan dikumpulkan sampah setelah periode perjalanan waktu. Jika Anda menambahkan data ke partisi yang masa berlakunya telah habis, data tersebut akan langsung habis masa berlakunya.

Mengubah dan membuat kueri tabel Iceberg terkelola berpartisi

Pernyataan dan kueri bahasa pengolahan data (DML) BigQuery untuk tabel terkelola Iceberg berpartisi sama dengan pernyataan dan kueri untuk tabel terkelola Iceberg standar. BigQuery secara otomatis mencakup tugas ke partisi yang tepat, mirip dengan partisi tersembunyi Iceberg. Selain itu, setiap data baru yang Anda tambahkan ke tabel akan otomatis dipartisi.

Anda juga dapat membuat kueri tabel terkelola Iceberg berpartisi dengan mesin lain dengan cara yang sama seperti tabel terkelola Iceberg standar. Sebaiknya aktifkan snapshot metadata untuk mendapatkan pengalaman terbaik.

Untuk keamanan yang ditingkatkan, informasi partisi untuk tabel yang dikelola Iceberg dipisahkan dari jalur data dan dikelola sepenuhnya oleh lapisan metadata.

Harga

Harga tabel terkelola Iceberg terdiri dari penyimpanan, pengoptimalan penyimpanan, serta kueri dan tugas.

Penyimpanan

Tabel terkelola Iceberg menyimpan semua data di Cloud Storage. Anda akan ditagih untuk semua data yang disimpan, termasuk data tabel historis. Biaya pemrosesan data dan transfer Cloud Storage juga mungkin berlaku. Beberapa biaya operasi Cloud Storage mungkin dibebaskan untuk operasi yang diproses melalui BigQuery atau BigQuery Storage API. Tidak ada biaya penyimpanan khusus BigQuery. Untuk mengetahui informasi selengkapnya, lihat Harga Cloud Storage.

Pengoptimalan penyimpanan

Tabel yang dikelola Iceberg melakukan pengelolaan tabel otomatis, termasuk pemadatan, pengelompokan, pembersihan sampah memori, dan pembuatan/pembaruan metadata BigQuery untuk mengoptimalkan performa kueri dan mengurangi biaya penyimpanan. Penggunaan resource komputasi untuk pengelolaan tabel ditagih dalam Unit Komputasi Data (DCU) dari waktu ke waktu, dengan peningkatan per detik. Untuk mengetahui detail selengkapnya, lihat Harga tabel terkelola Iceberg.

Operasi ekspor data yang terjadi saat streaming melalui Storage Write API disertakan dalam harga Storage Write API dan tidak ditagih sebagai pemeliharaan latar belakang. Untuk mengetahui informasi selengkapnya, lihat Harga penyerapan data.

Untuk melihat log dan penggunaan komputasi untuk operasi latar belakang ini, kueri tampilan INFORMATION_SCHEMA.JOBS. Untuk contoh kueri, lihat berikut ini:

Kueri dan tugas

Mirip dengan tabel BigQuery, Anda akan ditagih untuk kueri dan byte yang dibaca (per TiB) jika menggunakan harga BigQuery on-demand, atau penggunaan slot (per jam slot) jika menggunakan harga komputasi kapasitas BigQuery.

Harga BigQuery juga berlaku untuk BigQuery Storage Read API dan Storage Write API.

Operasi pemuatan dan ekspor (seperti EXPORT METADATA) menggunakan slot edisi Enterprise dengan harga sesuai penggunaan. Hal ini berbeda dengan tabel BigQuery, yang tidak dikenai biaya untuk operasi ini. Jika pemesanan PIPELINE dengan slot Enterprise atau Enterprise Plus tersedia, operasi pemuatan dan ekspor lebih memilih menggunakan slot pemesanan ini.

Batasan

Tabel terkelola Iceberg memiliki batasan berikut:

Tabel yang dikelola Iceberg tidak mendukung operasi penggantian nama atau pernyataan ALTER TABLE RENAME TO.
Tabel yang dikelola Iceberg tidak mendukung salinan tabel atau pernyataan CREATE TABLE COPY.
Tabel yang dikelola Iceberg tidak mendukung clone tabel atau pernyataan CREATE TABLE CLONE.
Tabel yang dikelola Iceberg tidak mendukung snapshot tabel atau pernyataan CREATE SNAPSHOT TABLE.
Tabel terkelola Iceberg tidak mendukung skema tabel berikut:
- Skema kosong
- Skema dengan jenis data BIGNUMERIC, INTERVAL, JSON, RANGE, atau GEOGRAPHY.
- Skema dengan kolasi kolom.
- Skema dengan ekspresi nilai default.
Tabel terkelola Iceberg tidak mendukung kasus evolusi skema berikut:
- Pemaksaan jenis NUMERIC ke FLOAT
- Pemaksaan jenis INT ke FLOAT
- Menambahkan kolom bertingkat baru ke kolom RECORD yang sudah ada menggunakan pernyataan DDL SQL
Tabel yang dikelola Iceberg menampilkan ukuran penyimpanan 0 byte saat dikueri oleh konsol atau API.
Tabel terkelola Iceberg tidak mendukung tampilan terwujud.
Tabel terkelola Iceberg tidak mendukung tabel virtual yang diizinkan, tetapi kontrol akses tingkat kolom didukung.
Tabel terkelola Iceberg tidak mendukung update pengambilan data perubahan (CDC).
Tabel terkelola Iceberg tidak mendukung disaster recovery terkelola
Tabel terkelola Iceberg tidak mendukung keamanan tingkat baris.
Tabel terkelola Iceberg tidak mendukung jendela aman.
Tabel terkelola Iceberg tidak mendukung tugas ekstraksi.
Tampilan INFORMATION_SCHEMA.TABLE_STORAGE tidak menyertakan tabel terkelola Iceberg.
Tabel terkelola Iceberg tidak didukung sebagai tujuan hasil kueri. Sebagai gantinya, Anda dapat menggunakan pernyataan CREATE TABLE dengan argumen AS query_statement untuk membuat tabel sebagai tujuan hasil kueri.
CREATE OR REPLACE tidak mendukung penggantian tabel standar dengan tabel yang dikelola Iceberg, atau tabel yang dikelola Iceberg dengan tabel standar.
Pemuatan batch dan pernyataan LOAD DATAhanya mendukung penambahan data ke tabel terkelola Iceberg yang ada.
Pemuatan batch dan pernyataan LOAD DATA tidak mendukung pembaruan skema.
TRUNCATE TABLE tidak mendukung tabel yang dikelola Iceberg. Ada dua alternatif:
- CREATE OR REPLACE TABLE, menggunakan opsi pembuatan tabel yang sama.
- DELETE FROM tabel WHERE benar (true)
Fungsi bernilai tabel (TVF) APPENDS tidak mendukung tabel yang dikelola Iceberg.
Metadata Iceberg mungkin tidak berisi data yang di-streaming ke BigQuery oleh Storage Write API dalam 90 menit terakhir.
Akses yang dipaginasi berbasis rekaman menggunakan tabledata.list tidak mendukung tabel terkelola Iceberg.
Hanya satu pernyataan DML bermutasi serentak (UPDATE, DELETE, dan MERGE) yang berjalan untuk setiap tabel yang dikelola Iceberg. Pernyataan DML bermutasi tambahan dimasukkan ke dalam antrean.