Google 推出有「思考預算」的 Gemini 2.5 Flash 模型

2025年4月18日下午3:14

緊接著三月底推出的 Gemini 2.5 Pro 之後，Google 今天又推出了 Gemini 2.5 Flash 的預覽版。和先前的 Flash 版本一樣，Gemini 2.5 Flash 也是強調「快速」的版本，但它同時也提供了使用者更細微的控制，附有一個「思考預算」的機制，讓開發者可以根據提示文來控制模型進行多少推理，平衡成本與生成文字的品質。

具體來說，開發者可以控制模型在思考時可以生成的 token 數量，範圍在 0 到 24,576 個 token 之間。在 Google AI Studio 和 Vertex AI 中可以透過滑桿進行設定，如果是透過 API 來使用的話，Google 也有提供一個對應的 API 參數。如果將思考預算設定為零，這個新模型的成本和延遲將與 2.0 Flash 相當。

Gemini 2.5 系列中的所有模型都具備推理能力，可以在回應之前先「思考回答的方式」，以提升性能並提高準確性。這對於需要多步驟推理的提示來說非常理想，例如數學問題和分析研究問題等。如果未指定預算，Gemini 2.5 Flash 會自動偵測任務的複雜性，來決定「思考」多少。除了依問題來決定思考的長短外，這也讓用戶可以指定特定工作的精細度。例如當你有一份長篇文章要分析時，可以用這個方式來決定結果是摘要式的短分析，還是長篇的分析了。

Gemini 2.5 Flash 的知識截止日期為相當新的 2025 年 1 月，並支援文字、圖片、影片、音訊等輸入，但只能輸出文字。其上下文窗口為 100 萬個 token，最大輸出長度則為 64,000 個 token。該模型已經在 Google AI Studio 及 Vertex AI 中向開發者提供，Gemini app 上也已經出現，取代了原本的 2.0 Flash Thinking。

🛒最新Adobe Creative Cloud優惠方案一覽👉立即訂閱

相關新聞：

引用自: https://tw.news.yahoo.com/google-%E6%8E%A8%E5%87%BA%E6%9C%89%E3%80%8C%E6%80%9D%E8%80%83%E9%A0%90%E7%

uttankwpc3g的部落格

歡迎光臨uttankwpc3g在痞客邦的小天地

參觀人氣

uttankwpc3g的部落格

歡迎光臨uttankwpc3g在痞客邦的小天地

Google 推出有「思考預算」的 Gemini 2.5 Flash 模型

你可能也喜歡

參觀人氣

成人內容提醒