Gemini Cloud Assist 사용

이 문서에서는 Cloud de Confiance by S3NS용 Gemini 포트폴리오의 제품인 Gemini Cloud Assist를 사용하여 BigQuery의 메타데이터, 작업, 쿼리를 이해하고 작업하는 방법을 설명합니다. Gemini Cloud Assist에서 사용할 수 있는 지원되는 사용 사례와 샘플 프롬프트를 제공합니다.

시작하기 전에

Gemini Cloud Assist를 사용하려면 먼저 관리자가 작업 중인 프로젝트 또는 폴더에 대해 Gemini Cloud Assist를 설정하는 단계를 수행해야 합니다.

Cloud de Confiance 리소스에 대한 질문과 요청을 지원하려면 Gemini Cloud Assist에 해당 리소스에 대한 적절한 Identity and Access Management (IAM) 권한이 필요합니다. BigQuery 데이터를 쿼리하도록 프롬프트를 표시하면 Gemini Cloud Assist가 사용자의 권한을 상속하므로 대부분의 경우 필요한 IAM 권한이 이미 부여되어 있습니다. 자세한 내용은 Gemini Cloud Assist 사용을 위한 IAM 요구사항을 참고하세요.

Gemini Cloud Assist 사용

  1. BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. In the Cloud de Confiance toolbar, click spark Open or close Gemini AI chat to open Gemini Cloud Assist chat.

    BigQuery 툴바의 Gemini Cloud Assist 버튼

  3. 프롬프트 입력 필드에 프롬프트를 입력합니다.

  4. 보내기 보내기를 클릭합니다.

다음 섹션에서는 Gemini Cloud Assist로 실행할 수 있는 작업의 예와 샘플 프롬프트를 제공합니다.

리소스 살펴보기

단일 프로젝트 또는 여러 프로젝트에서 데이터 세트 및 테이블 리소스를 검색하고 알아봅니다. Gemini Cloud Assist는 Knowledge Catalog를 사용하여 BigQuery 리소스를 검색합니다. 검색은 사용자의 권한을 사용하여 실행됩니다. 예를 들어 리소스의 메타데이터를 볼 권한이 없으면 결과에 표시되지 않습니다. 지원되는 사용 사례는 다음과 같습니다.

  • 이름으로 리소스 검색 Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.

    전자상거래라는 이름의 데이터 세트가 있나요?

  • 테이블의 메타데이터에 대해 질문하기. 이름으로 테이블에 대해 질문하거나 Gemini Cloud Assist가 채팅 기록 또는 활성 쿼리 탭에서 참조되는 테이블을 기반으로 사용자가 의미하는 테이블을 추론하도록 할 수 있습니다. 이름으로 테이블을 지정하는 경우 정규화된 이름을 사용해야 합니다. 테이블의 스키마 또는 파티셔닝, 클러스터링과 같은 기타 메타데이터에 대해 질문할 수 있습니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.

    PROJECT_NAME.DATASET_NAME.TABLE_NAME의 스키마는 뭐야?

  • 특정 정보를 찾을 수 있는 위치를 물어보세요. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.

    지난해 신규 사용자의 연령, 위치와 같은 인구통계는 어디에서 확인할 수 있나요?

코드 생성

Gemini Cloud Assist를 사용하여 데이터를 쿼리하고 분석하는 데 도움이 되는 SQL 및 Python 코드를 생성할 수 있습니다.

SQL 생성

쿼리가 수행할 작업을 설명하여 SQL 쿼리를 생성합니다. 최상의 결과를 얻으려면 쿼리할 테이블의 이름을 포함하세요. 예를 들어 Cloud Assist 패널에 다음과 비슷한 프롬프트를 입력합니다.

가장 긴 10개 경로의 기간과 구독자 유형을 보여주는 SQL 쿼리를 생성해 줘. bigquery-public-data.san_francisco_bikeshare.bikeshare_trips 표를 사용합니다.

Python 코드 생성

원하는 작업을 설명하여 Python 코드를 생성합니다. 예를 들어 Cloud Assist 패널에서 다음 프롬프트를 입력하여 BigQuery 매직 구문을 사용하여 공개 데이터 세트에서 penguins 테이블을 쿼리하도록 Gemini에 요청할 수 있습니다.

BigQuery 매직을 사용하여 bigquery-public-data.ml_datasets.penguins 테이블을 쿼리하는 Python 코드 생성

쿼리 예약

프롬프트에 다음 세부정보를 제공하여 쿼리를 예약합니다.

  • 일정(예: 매주 월요일 오후 5시 또는 격주 화요일 오전 2시)
  • 표시 이름
  • 대상 테이블 ID 및 대상 데이터 세트 ID
  • 시작 시간
  • 종료 시간
  • WRITE_EMPTY, WRITE_APPEND, WRITE_TRUNCATE와 같은 쓰기 처리

예를 들어 Cloud Assist 패널에서 다음과 유사한 프롬프트를 입력할 수 있습니다.

Schedule the query open in the editor to run daily. The display name
should be "test query". Write the results to a new table in mydataset
called scheduled_results. Use WRITE_APPEND. Start it now.

데이터 계보 추적

Gemini Cloud Assist를 사용하여 데이터 계보를 탐색하고 분석할 수 있습니다. 데이터 종속성을 파악하고, 구조적 변경의 영향을 평가하고, 복잡한 데이터 흐름을 요약하는 데 도움이 됩니다. 계보를 분석하려면 다음 기능 영역에서 Gemini Cloud Assist에 질문하면 됩니다.

  • 계보 통계 가져오기 계보 그래프에 관한 정량적 데이터(예: 관련된 총 애셋 수, 데이터 세트 수 또는 프로젝트 수)를 Gemini Cloud Assist에 요청합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.

    • Customer_Master에는 업스트림 애셋이 몇 개 있나요?
    • Customer_Interaction_Summary의 업스트림 계보에 포함된 BigQuery 데이터 세트는 몇 개야?
    • Marketing_Interaction의 업스트림 그래프에 있는 모든 고유 애셋의 수를 제공합니다.
  • 직접 종속 항목 분석 한 번의 이동 관계를 분석하여 특정 애셋의 직접 상위 요소 (소스) 또는 직접 하위 요소 (소비자)를 식별합니다. Cloud Assist 패널에 다음과 비슷한 프롬프트를 입력합니다.

    • Customer_Master의 직접적인 소스는 무엇인가요?
    • Card_Master 테이블의 직접 소비자는 누구인가요?
    • Web_Session_Validated의 직접 소스는 무엇인가요?
  • 다운스트림 영향 평가 애셋을 수정하거나 삭제할 때의 다운스트림 결과를 이해합니다. 깊이 (홉 수) 또는 특정 프로젝트 경계로 이러한 프롬프트를 범위 지정할 수 있습니다. Cloud Assist 패널에 다음과 비슷한 프롬프트를 입력합니다.

    • Customer_Master를 삭제하면 어떤 애셋이 영향을 받나요?
    • Customer_Master에서 2홉 이내에 있는 다운스트림 애셋을 보여 줘.
    • Customer_Master를 변경하면 'data-lineage-manual-tests' 프로젝트의 애셋에 영향을 미치나요?
  • 루트 소스 및 최종 대상 식별. 중간 변환 단계를 우회하여 데이터의 최종 출처 또는 최종 대상을 찾습니다. Cloud 어시스트 패널에 다음과 유사한 프롬프트를 입력합니다.

    • Customer_Master의 모든 최종 데이터 소스는 무엇인가요?
    • 중간 테이블을 제외한 Transaction_Data_Enriched의 원래 데이터 소스는 무엇인가요?
    • Card_Data_Validated의 최종 데이터 대상은 무엇인가요?
  • 애셋 간 데이터 흐름 추적 Gemini Cloud Assist에 두 개의 알려진 애셋 간의 특정 연결, 경로 또는 데이터 흐름을 설명해 달라고 요청합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.

    • Customer_Master는 Customer_Data_Raw에 어떻게 종속되나요?
    • Customer_Data_Raw에서 Customer_Profile_Snapshot으로 데이터 흐름은 어떻게 되나요?
    • Customer_Data_Raw와 Alert_Fact 사이에 홉이 몇 개 있나요?
  • 애셋 유형 또는 이름으로 계보 필터링 연결된 특정 유형의 애셋 (예: BigQuery 뷰 또는 Looker 대시보드) 또는 특정 명명 패턴과 일치하는 애셋을 검색합니다. Cloud Assist 패널에 다음과 비슷한 프롬프트를 입력합니다.

    • Customer_Master가 BigQuery 뷰에 사용되나요?
    • Customer_Master의 다운스트림에 Looker 대시보드가 있나요?
    • Customer_Master의 업스트림 테이블 중 이름에 'Country'가 포함된 테이블은 무엇인가요?
  • 계보 그래프 요약 특정 목록이나 개수 대신 애셋의 계보에 대한 자연어 개요를 요청합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.

    • Web_Session_Validated에 종속된 애셋의 요약을 알려 줘.
    • 이 테이블의 다운스트림 계보를 요약해 줘.
    • bigquery:PROJECT_NAME.DATASET_NAME의 계보는 무엇인가요?

작업 분석

개인 작업 기록 및 프로젝트 작업 기록을 비롯하여 프로젝트에서 실행된 작업에 대해 자세히 알아보고 다음 사용 사례를 지원하세요.

  • 장기 실행 쿼리 디버그 작업의 현재 상태와 슬롯 경합, 스캔된 행 수, 데이터 볼륨 등 예상보다 오래 걸리는 이유를 알아봅니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.

    이 작업이 이렇게 오래 걸리는 이유는 무엇인가요? JOB_ID

  • 실패한 작업의 원인 분석 특정 쿼리가 실패한 이유를 알아봅니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.

    JOB_ID이(가) 실패한 이유는 무엇인가요?

  • 리소스 집약적인 쿼리 찾기 처리된 예상 바이트 수를 기준으로 가장 비용이 많이 드는 쿼리를 알아봅니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력합니다.

    지난 2일 동안 실행한 쿼리 중 비용이 가장 많이 든 3개는 무엇인가요?

BigQuery 관리

작업 탐색기에서 Gemini Cloud Assist와 채팅하여 성능을 모니터링하고, 용량을 분석하고, 비용을 최적화할 수 있습니다. 예를 들어 Gemini Cloud Assist를 사용하여 다음 작업을 수행할 수 있습니다.

  • 예약 및 용량 분석 자연어를 사용하여 컴퓨팅 사용률을 모니터링하고 병목 현상을 식별합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력할 수 있습니다.

    • 지난 24시간 동안의 예약 실적을 분석해 줘.
    • 내 '프로덕션' 예약에 사용되는 상위 프로젝트와 사용자를 표시해 줘.
    • 현재 용량이 최대 부하를 처리하기에 충분한가요?
  • 작업 모니터링 및 비교 워크로드를 비교하여 성능 변화를 파악합니다. 병목 현상과 최적화 기회를 강조하는 작업 실적 요약을 확인하거나 다양한 작업의 실행 세부정보를 직접 비교하여 회귀 또는 개선사항을 파악할 수 있습니다.

  • 워크로드 관리 구성 자연어를 사용하여 할당 및 약정을 비롯한 BigQuery 예약 설정을 검사하고 관리합니다. 이 기능을 사용하면 자동 확장 구성, 유휴 슬롯 관리, 버전별 세부정보를 확인할 수 있습니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력할 수 있습니다.

    • 자동 확장으로 내 예약을 나열해 줘.
    • PROJECT_ID의 과제를 보여 줘.
    • 예약 RESERVATION_NAME의 구성은 무엇인가요?
    • 내 약정 목록을 보여 줘.
    • 유휴 슬롯 무시가 구성된 예약은 몇 개인가요?
    • 버전(Enterprise)별로 모든 예약을 나열합니다.
    • 현재 모든 예약을 나열하고 각 예약의 slot_capacity와 autoscale_max_slots를 표시해 줘.
  • 인기 리소스 식별 BigQuery 리소스의 기본 소비자를 식별합니다. 어시스턴트는 특정 프로젝트 또는 예약 내 슬롯 사용률을 기반으로 상위 사용자 및 작업을 표시할 수 있습니다. 이 지원은 작업, 사용자, 프로젝트, 예약 등 중요한 BigQuery 리소스 전반에 걸쳐 포괄적인 관리 지원을 제공합니다. 어시스턴트는 슬롯 사용량, 작업 기간과 같은 주요 실적 측정항목을 분석하여 모니터링을 간소화하고 리소스 할당을 최적화할 수 있는 실행 가능한 통계를 제공합니다. Cloud Assist 패널에 다음과 유사한 프롬프트를 입력할 수 있습니다.

    • 내 프로젝트에서 슬롯 사용량이 가장 많은 상위 사용자는 누구야?
    • 지난 한 시간 동안 예약 RESERVATION_NAME에서 가장 많은 슬롯을 사용한 상위 작업을 보여 줘.

쿼리 최적화

Gemini Cloud Assist를 사용하여 SQL 쿼리를 분석하고 최적화 추천을 받으세요. Gemini Cloud Assist는 쿼리 구조를 분석하고 가능한 경우 쿼리 슬롯 시간을 줄일 수 있는 개선사항을 제안합니다. 다음 방법 중 하나를 사용하여 쿼리를 최적화할 수 있습니다.

  • 쿼리 편집기에서 최적화를 클릭합니다. 이 버튼은 BigQuery 버전을 사용하는 경우에만 사용할 수 있습니다.

    1. BigQuery 페이지로 이동합니다.

      BigQuery로 이동

    2. 쿼리 편집기에서 SQL 쿼리를 입력하고 실행합니다.

    3. 쿼리 편집기 툴바에서 최적화를 클릭합니다. Gemini Cloud Assist는 실행된 쿼리를 분석하고 Cloud Assist 패널에 추천을 표시합니다.

  • Cloud Assist 패널을 사용합니다. 활성 탭에서 쿼리를 열거나 SQL 코드를 Cloud 어시스턴트 패널에 직접 붙여넣고 최적화를 요청할 수 있습니다. 이 기능은 용량 가격 책정 (BigQuery 버전)을 사용하는지 주문형 가격 책정을 사용하는지에 관계없이 모든 고객이 사용할 수 있습니다.

다음 단계