リソースを検索する
Dataplex Universal Catalog の検索機能を使うと、BigQuery 内から BigQuery のデータセットやテーブルなどの Trusted Cloud リソースを探すことができます。
Dataplex Universal Catalog の検索は、自然言語検索クエリ(セマンティック検索クエリとも呼ばれる)に対応しており、日常的な言葉でリソースを検索できます。
自然言語検索は、キーワード検索と同様にリソースの検出に重点を置いており、そのために、組織内のリソースに関連付けられているメタデータを分析します。検索では、作成したメタデータなど、リソースを説明する幅広いメタデータが考慮されます。
自然言語検索は、適合率ではなく再現率の向上に重点を置いています。
BigQuery でテーブルデータを検索する方法の詳細については、BigQuery での検索の概要をご覧ください。
登録してプレビューする
プレビュー版に登録するには、Google アカウント担当者が登録フォームに記入してリクエストを送信する必要があります。フォームを送信すると、Dataplex チームから次の手順について連絡が届きます。
始める前に
BigQuery で自然言語検索を使用してTrusted Cloud リソースを検索する前に、このセクションのタスクを完了してください。
必要なロール
リソースを検索するには、検索に使用されるプロジェクトで、Dataplex Catalog 管理者、Dataplex Catalog 編集者、または Dataplex Catalog 閲覧者のいずれかの Dataplex Universal Catalog IAM ロールが必要です。検索結果に対する権限は、選択したプロジェクトとは別にチェックされます。
BigQuery の検索結果は、基盤となるリソースに対する IAM 権限に基づいてスコープ設定されます。BigQuery でリソースを検索するには、対応するリソースにアクセスする権限が必要です。詳細については、このドキュメントの検索範囲のセクションをご覧ください。
たとえば、BigQuery のデータセット、テーブル、ビュー、モデルを検索するには、それらのリソースにアクセスするためのそれぞれの権限が必要です。詳細については、BigQuery の権限をご覧ください。次のリストに、最低限必要な権限を示します。
- テーブルを検索するには、そのテーブルに対する
bigquery.tables.get
権限が必要です。 - データセットを検索するには、そのデータセットに対する
bigquery.datasets.get
権限が必要です。
BigQuery メタデータ閲覧者のロール(roles/bigquery.metadataViewer
)には bigquery.tables.get
権限と bigquery.datasets.get
権限の両方が含まれており、任意の BigQuery リソースを検索できます。
ロールの付与の詳細については、アクセス権の管理についてのページをご覧ください。
必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。
API を有効にする
検索を使用するには、Dataplex API が有効になっていることを確認してください。Dataplex API は、BigQuery を使用するすべての新しい Trusted Cloud プロジェクトでデフォルトで有効になっています。プロジェクトで Dataplex API が有効になっていない場合は、Dataplex Universal Catalog を有効にするをご覧ください。
リソースを検索する
Trusted Cloud コンソールで、BigQuery の検索ページに移動します。
検索フィールドに自然言語でクエリを入力し、Enter キーを押します。次のクエリはサンプルです。
Show me the datasets that contain taxi information
Find data on vaccine distribution across different countries
Get tables with historical temperature data for major world cities
Search for hurricane tracking and storm activity datasets
Population data by country
検索結果をフィルタするには、[フィルタ] をクリックします。次のフィルタを使用できます。
- スコープ: 組織全体(デフォルト)、現在のプロジェクト、またはスター付きリソースのみを検索します。詳細については、このドキュメントの検索範囲のセクションをご覧ください。
- システム: リソースが属する Trusted Cloud サービス(BigQuery など)。Dataplex Universal Catalog システムにはエントリ グループが含まれています。
- プロジェクト: 検索するプロジェクト。
- タイプ: リソースタイプ(BigQuery 接続、Cloud Storage バケット、データベースなど)。リソースタイプによっては、接続タイプや SQL 言語などのサブタイプでフィルタすることもできます。
- ロケーションの選択: 検索するロケーション。
- データセットを選択します: 検索結果を、選択した BigQuery データセットに属する BigQuery リソースに制限します。[フィルタ テキストを入力] フィールドに、データセットの名前を入力します。
- アノテーション: 検索対象のリソースに関連付けられている Dataplex Universal Catalog のアスペクト タイプ。アスペクト値でフィルタするには、[アノテーション値でフィルタ] をクリックし、値を選択します。
フィルタを削除するには、削除するフィルタの横にある
[クリア] をクリックします。すべてのフィルタを削除するには、[フィルタをクリア] をクリックします。フィルタの評価方法の詳細については、このドキュメントのフィルタセクションをご覧ください。
省略可: リソースの詳細を表示するには、検索結果でリソース名をクリックします。
分割ペインにリソースの概要が開きます。以下のいずれかの操作を行います。
- リソースが属するサービスでリソースを開くには、リソースの [PRODUCT_NAME で開く] をクリックします。たとえば、BigQuery Studio で BigQuery データセットを開くには、[Studio で開く] をクリックします。使用できるオプションはリソースによって異なります。
- リソースに関連付けられている Dataplex Universal Catalog メタデータを表示するには、リソースの [Dataplex Catalog で開く] をクリックします。
- ブックマークしたい重要な検索結果がある場合は、スターを付けることができます。リソースの [スター] をクリックします。スター付きリソースは BigQuery Studio で表示できます。
- 分割ペインのリソースの概要を閉じるには、[ 閉じる] をクリックします。
フィルタ
フィルタを使用すると、検索結果を絞り込むことができます。
複数のセクションでフィルタを指定すると、フィルタは AND
論理演算子を使用して評価されます。検索結果には、選択したすべてのセクションで 1 つ以上の条件に一致するリソースが含まれます。たとえば、BigQuery システムと dataset
リソースタイプを選択した場合、検索結果には BigQuery データセットが含まれますが、Vertex AI データセットは含まれません。
1 つのセクション内で複数のフィルタを選択すると、フィルタは OR
論理演算子を使用して評価されます。たとえば、dataset
リソースタイプと table
リソースタイプを選択すると、検索結果にはデータセットとテーブルの両方が含まれます。
検索範囲
Trusted Cloud 組織に属するプロジェクトの場合、検索はその組織のスコープ内で実行されます。
検索結果には、リソースに対する権限が適用されます。たとえば、リソースに対する BigQuery メタデータの読み取りアクセス権を持っている場合、そのリソースは検索結果に表示されます。ある BigQuery テーブルへのアクセス権はあるが、そのテーブルを含むデータセットへのアクセス権がない場合でも、そのテーブルは検索結果に通常どおり表示されます。
検索結果には、検索が実行されるプロジェクトと同じ VPC Service Controls 境界に属するリソースのみが表示されます。 Trusted Cloud コンソールを使用する場合、これはコンソールで選択したプロジェクトです。
次のステップ
- BigQuery Studio でデータを分析する方法を学習する。
- Dataplex Universal Catalog でキーワード検索を使用する方法を確認する。