載入及查詢資料

如要開始使用 BigQuery,請建立資料集、將資料載入資料表,並查詢資料表。

事前準備

您必須先登入Trusted Cloud 控制台並建立專案,才能探索 BigQuery。如果未在專案中啟用帳單功能,您上傳的所有資料都會進入 BigQuery 沙箱模式。沙箱機制可讓您免費使用部分 BigQuery 功能,藉此熟悉 BigQuery 的操作方式。詳情請參閱「啟用 BigQuery 沙箱」一文。

  1. In the Trusted Cloud console, on the project selector page, select or create a Trusted Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  2. 選用:如果您選取現有專案,請務必啟用 BigQuery API。新專案會自動啟用 BigQuery API。
  3. 建立 BigQuery 資料集

    透過 Trusted Cloud 控制台在美國多區域位置建立資料集來儲存資料。如要瞭解 BigQuery 單一地區與多地區,請參閱位置的相關說明。

    1. 在 Trusted Cloud 控制台開啟 BigQuery 頁面。
    2. 前往 BigQuery
    3. 「Explorer」窗格,點按專案名稱。
    4. 按一下 。 按一下「查看動作」
    5. 選取「Create dataset」(建立資料集)
    6. 在「建立資料集」頁面中,執行下列操作:
      1. 在「Dataset ID」(資料集 ID) 中輸入 babynames
      2. 針對「位置類型」選取「多區域」,然後選擇「美國 (多個美國地區)」。公開資料集儲存在 us 多地區位置。為簡單起見,請將資料集儲存在相同位置。
      3. 其餘設定請保留預設狀態,然後按一下「Create dataset」(建立資料集)

    下載含有來源資料的檔案

    您下載的檔案包含約 7 MB 的熱門新生兒命名資料,這項資料是由美國社會安全局提供。

    如要進一步瞭解資料,請參閱美國社會安全局的熱門名字的背景資訊

    1. 在新的瀏覽器分頁中開啟下列網址,下載美國社會安全局的資料:

      https://www.ssa.gov/OACT/babynames/names.zip
      
    2. 將檔案解壓縮。

      如要進一步瞭解資料集結構定義,請參閱 ZIP 檔案中的 NationalReadMe.pdf 檔案。

    3. 如要查看資料樣貌,請開啟 yob2024.txt 檔案。這個逗號分隔值檔案內含名字、出生時判定的性別,以及同名的新生兒人數,這個檔案沒有標題列。

    4. 請記下 yob2024.txt 檔的位置,以便稍後尋找。

    將資料載入資料表

    接著,將資料載入新資料表。

    1. 「Explorer」窗格,展開專案名稱。
    2. babynames 資料集旁邊,依序點選 「查看動作」和「開啟」
    3. 按一下「建立資料表」

      除非另有指示,否則請保留所有設定的預設值。

    4. 在「建立資料表」頁面中,執行下列操作:
      1. 在「Source」(來源) 專區中,從「Create table from」(建立資料表來源) 的清單中選擇「Upload」(上傳)
      2. 在「Select file」(選取檔案) 欄位,點按「Browse」(瀏覽)
      3. 找到並開啟本機中的 yob2024.txt 檔案,然後點按「Open」(開啟)
      4. 「File format」(檔案格式) 清單選擇「CSV」
      5. 在「Destination」(目的地) 專區的「Table」(資料表) 欄位,輸入 names_2024
      6. 在「Schema」(結構定義) 專區,點按「Edit as text」(以文字形式編輯) 切換按鈕,然後將下列結構定義貼入文字欄位:
      7. name:string,assigned_sex_at_birth:string,count:integer
      8. 點按「Create table」(建立資料表)

        等待 BigQuery 建立資料表及載入資料。

    預覽資料表資料

    如要預覽資料表資料,請按照下列步驟操作:

    1. 「Explorer」窗格,展開專案和 babynames 資料集,然後選取 names_2024 資料表。
    2. 點按「Preview」(預覽) 分頁標籤,BigQuery 會顯示資料表的前幾個資料列。
    3. 資料表預覽分頁。
    「預覽」分頁標籤不適用於所有表格類型。舉例來說,外部資料表或檢視表不會顯示「預覽」分頁。

    查詢資料表資料

    接著是查詢資料表。

    1. 在「names_2024」分頁旁,按一下「SQL query」(SQL 查詢) 選項 。系統會開啟新的編輯器分頁。
    2. 將下列查詢貼入查詢編輯器,這項查詢會擷取 2024 年在美國出生,且當判定為男性的前五名熱門男嬰名字。
      
        SELECT
          name,
          count
        FROM
          `babynames.names_2024`
        WHERE
          assigned_sex_at_birth = 'M'
        ORDER BY
          count DESC
        LIMIT
          5;
        
    3. 按一下「Run」(執行)。 查詢結果會顯示在「Query results」(查詢結果) 部分中。
      查詢結果面板

    您已成功使用 Trusted Cloud 控制台查詢公開資料集內的資料表,並將範例資料載入 BigQuery。

    清除所用資源

    如要避免系統向您的 Trusted Cloud 帳戶收取本頁所用資源的費用,請按照下列步驟操作。

    1. 在 Trusted Cloud 控制台開啟「BigQuery」頁面。
    2. 前往 BigQuery
    3. 在「Explorer」窗格中,按一下您建立的 babynames 資料集。
    4. 展開「查看動作」選項,然後按一下「刪除」
    5. 在「Delete dataset」(刪除資料集) 對話方塊中,確認刪除指令:輸入字詞 delete,然後按一下「Delete」(刪除)

    後續步驟