데이터세트 소개
이 페이지에서는 BigQuery의 데이터세트에 대해 간략히 설명합니다.
데이터 세트
데이터세트는 특정 프로젝트에 포함됩니다. 데이터 세트는 테이블과 뷰에 대한 액세스를 구성 및 제어하는 데 사용되는 최상위 컨테이너입니다. 테이블이나 뷰는 반드시 데이터 세트에 속해야 하므로, 개발자는 최소한 한 개 이상의 데이터 세트를 만든 후에 데이터를 BigQuery로 로드해야 합니다.
GoogleSQL을 사용할 경우 데이터 세트 이름을 정규화하려면 projectname.datasetname
형식을 사용하거나 bq 명령줄 도구를 사용할 때 projectname:datasetname
형식을 사용하여 데이터 세트 이름을 정규화합니다.
위치
데이터 세트를 만들 때는 BigQuery 데이터를 저장할 위치를 지정해야 합니다. BigQuery 데이터 세트 위치 목록은 BigQuery 위치를 참조하세요. 데이터 세트를 만든 후에는 위치를 변경할 수 없지만할 수 있습니다.
BigQuery는 쿼리 중인 테이블이 포함된 데이터 세트와 동일한 위치에 있는 쿼리를 처리합니다. BigQuery는에 따라 선택된 위치에 데이터를 저장합니다.
데이터 보관
데이터 세트는 안전 조치 기간과 함께 시간 이동을 사용하여 나중에 복구할 필요가 있을 경우에 대비하여 삭제 및 수정된 데이터를 짧은 기간 동안 보관합니다. 자세한 내용은 시간 이동 및 장애 안전을 통해 데이터 보관을 참고하세요.
외부 데이터 세트
BigQuery 데이터 세트 외에도 외부 데이터 소스에 대한 링크인 외부 데이터 세트를 만들 수 있습니다.
외부 데이터 세트는 제휴 데이터 세트라고도 하며 두 용어는 같은 의미로 사용됩니다.
생성된 외부 데이터 세트에는 참조된 외부 데이터 소스의 테이블이 포함됩니다. 이러한 테이블의 데이터는 BigQuery에 복사되지 않지만 사용될 때마다 쿼리됩니다. 자세한 내용은 Spanner 통합 쿼리를 참고하세요.
제한사항
BigQuery 데이터 세트에는 다음과 같은 제한사항이 적용됩니다.
- 데이터 세트 위치는 생성 당시에만 설정할 수 있습니다. 데이터 세트를 만든 후에는 위치를 변경할 수 없습니다.
- 쿼리에서 참조하는 모든 테이블은 같은 위치의 데이터 세트에 저장해야 합니다.
외부 데이터 세트는 테이블 만료, 복제본, 시간 이동, 기본 콜레이션, 기본 반올림 모드 또는 대소문자를 구분하지 않는 테이블 이름을 사용 설정하거나 사용 중지하는 옵션을 지원하지 않습니다.
테이블을 복사할 때 소스 테이블과 대상 테이블을 포함하는 데이터 세트는 같은 위치에 있어야 합니다.
프로젝트마다 데이터 세트 이름이 달라야 합니다.
할당량
데이터 세트 할당량과 한도에 대한 자세한 내용은 할당량 및 한도를 참조하세요.
보안
BigQuery에서 데이터 세트에 대한 액세스를 제어하려면 데이터 세트에 대한 액세스 제어를 참조하세요. 데이터 암호화에 대한 자세한 내용은 저장 데이터 암호화를 참조하세요.
다음 단계
- 데이터 세트 만들기에 대한 자세한 내용은 데이터 세트 만들기를 참조하세요.
- 데이터 세트에 대한 액세스 제어 할당에 대한 자세한 내용은 데이터 세트에 대한 액세스 제어를 참조하세요.