選擇轉錄函式

本文件比較了 BigQuery ML 提供的轉錄函式,分別是 ML.GENERATE_TEXTML.TRANSCRIBE

您可以參考本文件中的資訊,在函式功能重疊時決定要使用哪個函式。

這些函式的差異如下:

  • ML.GENERATE_TEXT 是轉錄 10 分鐘或更短音訊片段的理想選擇,您也可以使用它執行自然語言處理 (NLP) 工作。使用 gemini-1.5-flash 模型時,使用 ML.GENERATE_TEXT 進行音訊轉錄的費用會比使用 ML.TRANSCRIBE 便宜。

  • ML.TRANSCRIBE 是處理超過 10 分鐘的音訊片段轉錄作業的理想選擇。並支援比 ML.GENERATE_TEXT 更廣泛的語言。

支援的模型

支援的型號如下:

支援的工作

支援的任務如下:

  • ML.GENERATE_TEXT:您可以執行音訊轉錄和自然語言處理 (NLP) 工作。
  • ML.TRANSCRIBE:你可以進行語音轉錄。

定價

定價如下:

  • ML.GENERATE_TEXT:如要瞭解您搭配此函式使用的 Vertex AI 模型定價,請參閱 Vertex AI 定價。針對支援的模型進行受控調整時,系統會以每小時每節點美元計費。詳情請參閱「Vertex AI 自訂訓練定價」。
  • ML.TRANSCRIBE:如要瞭解與此函式搭配使用的 Cloud AI 服務定價,請參閱Speech-to-Text API 定價

監督式調整

監督式調整支援功能如下:

  • ML.GENERATE_TEXT:部分模型支援監督式調整
  • ML.TRANSCRIBE:不支援監督式調整。

每分鐘查詢次數 (QPM) 上限

QPM 限制如下:

  • ML.GENERATE_TEXTgemini-1.5-pro 模型的預設 us-central1 區域為 60 QPM,gemini-1.5-flash 模型的預設 us-central1 區域為 200 QPM。詳情請參閱「Vertex AI 生成式 AI 配額」。
  • ML.TRANSCRIBE:每個專案每分鐘 900 次查詢。詳情請參閱「配額與限制」。

如要提高配額,請參閱「要求調整配額」一文。

詞元數量上限

符記限制如下:

  • ML.GENERATE_TEXT:700 個輸入符記和 8196 個輸出符記。這項輸出符記限制表示 ML.GENERATE_TEXT 針對個別音訊片段的限制為約 39 分鐘。
  • ML.TRANSCRIBE:沒有符記限制。不過,這項功能的個別音訊片段長度上限為 480 分鐘。

支援的語言

支援的語言如下:

適用地區

適用地區如下:

  • ML.GENERATE_TEXT:適用於所有 Vertex AI 生成式 AI 區域
  • ML.TRANSCRIBE:適用於 EUUS 多地區的所有語音辨識器。