GPT Image 1.5 簡介
GPT Image 1.5 是 OpenAI 為創作者提供的 AI 圖像生成器,具有 4 倍快速的生成速度、精準的編輯功能,以及搭載 Transformer-Diffusion 架構的文字渲染能力。
GPT Image 1.5 是什麼
GPT Image 1.5於2025年12月16日發布,是OpenAI至今為止功能最強大的文字轉圖像模型。它基於GPT-5.2多模態架構,圖像生成速度比GPT 1快高達四倍,同時以高保真度保留文字、標誌和面部特徵。使用者可以透過GPT Image 1 API或Azure整合存取此模型,並可享受輸入和輸出均降低20%的價格。此模型支援精確的對話式編輯——僅需一條文字指令即可更改光線或顏色,而無需重新生成整個構圖。GPT Image 1.5在海報和資訊圖表等密集文字渲染方面也表現卓越。諸如「迷你」模式用於快速原型製作以及進階編輯工具等功能使其適用於尋求經濟高效、高品質圖像生成的設計師、創作者和企業品牌。
GPT Image 1.5 如何運作
GPT Image 1.5 於 2025 年 12 月 16 日推出,建構於 OpenAI 的 GPT-5.2 多模態骨幹網絡之上,透過結合變壓器編碼器與擴散生成器,實現快速的文字轉圖像合成。此模型提供四倍的生成速度,將複雜提示的生成時間降低至兩分鐘內,簡單提示則縮短至幾秒,並且相比 GPT Image 1,API 成本降低 20%。精確的編輯指令能保留光線、構圖、商標和臉部辨識度,同時,密集的文字渲染在行銷圖像方面勝過競爭對手。GPT Image 1.5 透過 OpenAI 的 API、Azure 以及免費額度預覽提供。
GPT Image 1.5 的優點
GPT Image 1.5 提供更快速的製作速度,生成速度比前代模型快高達四倍,因此能為學生專案和企業目錄進行簡潔的迭代。其精準的局部編輯功能 (GPT Image Edit 1.5) 允許使用者修改光線、顏色或文字,而無需重新生成整個圖像,進而保留光線、構圖、標誌和面部特徵。此模型在密集文字渲染方面表現出色,能夠為海報、菜單和資訊圖表提供清晰易讀的字體。 品牌一致性藉由編輯過程中的穩定標誌和面部特徵保留而得以確保,非常適合用於行銷素材。API 定價降低了 20%,與 gpt image 定價優勢相符,讓您能在有限的預算內進行更多實驗。
GPT Image 1.5 的優點和缺點
Pros
- 4 倍更快的圖像生成。
- 精準的局部編輯保持上下文。
- 優秀的高密度文本渲染能力。
- 一致的 logo 與人像保存。
- API 價格降低 20%。
Cons
- 免費版僅限 2 积分。
- 分辨率上限為 1536×1024。
- 目前不支援 4K 輸出。
- 額外使用需訂閱 API。
