緊接著三月底推出的 Gemini 2.5 Pro 之後,Google 今天又推出了 Gemini 2.5 Flash 的預覽版。和先前的 Flash 版本一樣,Gemini 2.5 Flash 也是強調「快速」的版本,但它同時也提供了使用者更細微的控制,附有一個「思考預算」的機制,讓開發者可以根據提示文來控制模型進行多少推理,平衡成本與生成文字的品質。
具體來說,開發者可以控制模型在思考時可以生成的 token 數量,範圍在 0 到 24,576 個 token 之間。在 Google AI Studio 和 Vertex AI 中可以透過滑桿進行設定,如果是透過 API 來使用的話,Google 也有提供一個對應的 API 參數。如果將思考預算設定為零,這個新模型的成本和延遲將與 2.0 Flash 相當。
Gemini 2.5 系列中的所有模型都具備推理能力,可以在回應之前先「思考回答的方式」,以提升性能並提高準確性。這對於需要多步驟推理的提示來說非常理想,例如數學問題和分析研究問題等。如果未指定預算,Gemini 2.5 Flash 會自動偵測任務的複雜性,來決定「思考」多少。除了依問題來決定思考的長短外,這也讓用戶可以指定特定工作的精細度。例如當你有一份長篇文章要分析時,可以用這個方式來決定結果是摘要式的短分析,還是長篇的分析了。
Gemini 2.5 Flash 的知識截止日期為相當新的 2025 年 1 月,並支援文字、圖片、影片、音訊等輸入,但只能輸出文字。其上下文窗口為 100 萬個 token,最大輸出長度則為 64,000 個 token。該模型已經在 Google AI Studio 及 Vertex AI 中向開發者提供,Gemini app 上也已經出現,取代了原本的 2.0 Flash Thinking。
🛒最新Adobe Creative Cloud優惠方案一覽👉立即訂閱
相關新聞:
引用自: https://tw.news.yahoo.com/google-%E6%8E%A8%E5%87%BA%E6%9C%89%E3%80%8C%E6%80%9D%E8%80%83%E9%A0%90%E7%
請先 登入 以發表留言。