選擇轉錄函式
本文件比較了 BigQuery ML 提供的轉錄函式,分別是 ML.GENERATE_TEXT
和 ML.TRANSCRIBE
。
您可以參考本文件中的資訊,在函式功能重疊時決定要使用哪個函式。
這些函式的差異如下:
ML.GENERATE_TEXT
是轉錄 10 分鐘或更短音訊片段的理想選擇,您也可以使用它執行自然語言處理 (NLP) 工作。使用gemini-1.5-flash
模型時,使用ML.GENERATE_TEXT
進行音訊轉錄的費用會比使用ML.TRANSCRIBE
便宜。ML.TRANSCRIBE
是處理超過 10 分鐘的音訊片段轉錄作業的理想選擇。並支援比ML.GENERATE_TEXT
更廣泛的語言。
支援的模型
支援的型號如下:
ML.GENERATE_TEXT
:您可以使用 Vertex AI Gemini 模型的子集生成文字。如要進一步瞭解支援的模型,請參閱ML.GENERATE_TEXT
語法。ML.TRANSCRIBE
:您使用 Speech-to-Text API 的預設模型。使用 Document AI API 可讓您使用 Chirp 語音模型進行轉錄。
支援的工作
支援的任務如下:
ML.GENERATE_TEXT
:您可以執行音訊轉錄和自然語言處理 (NLP) 工作。ML.TRANSCRIBE
:你可以進行語音轉錄。
定價
定價如下:
ML.GENERATE_TEXT
:如要瞭解您搭配此函式使用的 Vertex AI 模型定價,請參閱 Vertex AI 定價。針對支援的模型進行受控調整時,系統會以每小時每節點美元計費。詳情請參閱「Vertex AI 自訂訓練定價」。ML.TRANSCRIBE
:如要瞭解與此函式搭配使用的 Cloud AI 服務定價,請參閱Speech-to-Text API 定價。
監督式調整
監督式調整支援功能如下:
ML.GENERATE_TEXT
:部分模型支援監督式調整。ML.TRANSCRIBE
:不支援監督式調整。
每分鐘查詢次數 (QPM) 上限
QPM 限制如下:
ML.GENERATE_TEXT
:gemini-1.5-pro
模型的預設us-central1
區域為 60 QPM,gemini-1.5-flash
模型的預設us-central1
區域為 200 QPM。詳情請參閱「Vertex AI 生成式 AI 配額」。ML.TRANSCRIBE
:每個專案每分鐘 900 次查詢。詳情請參閱「配額與限制」。
如要提高配額,請參閱「要求調整配額」一文。
詞元數量上限
符記限制如下:
ML.GENERATE_TEXT
:700 個輸入符記和 8196 個輸出符記。這項輸出符記限制表示ML.GENERATE_TEXT
針對個別音訊片段的限制為約 39 分鐘。ML.TRANSCRIBE
:沒有符記限制。不過,這項功能的個別音訊片段長度上限為 480 分鐘。
支援的語言
支援的語言如下:
適用地區
適用地區如下: