LTX 2.3 的常見問題解答
LTX 2.3 是什麼?
LTX 2.3 是由 Lightricks 基於 Diffusion Transformer (DiT) 架構構建的 220 億參數開源 AI 影片模型。它支援文字到影片、圖片到影片、音訊到影片和影片到影片生成,具備原生縱向輸出、重建的 VAE 以及 4 倍擴展的文字連接器,以實現更準確的提示解釋。模型權重在 Hugging Face 上提供,適用於開發版和蒸餾版檢查點。
我需要強大的 GPU 或本地桌面設定嗎?
不需要。在 ltx23.app 上,所有渲染都在雲端進行——無需本地 GPU、VRAM 或桌面安裝。如果您偏好本地運行,LTX 2.3 支援 ComfyUI 工作流和 GGUF/FP8 量化格式以降低硬體要求。推薦的本地設定是 NVIDIA GPU,配備 32 GB+ VRAM、32 GB RAM 和 Windows 系統上的 60 GB 儲存空間。
LTX 2.3 與 WAN 2.2 等其他影片模型相比如何?
在 H100 GPU 上,LTX 2 系列的吞吐量約為 WAN 2.2 14B 的 18 倍,使其在批次渲染方面顯著更快。LTX 2.3 還引入了原生 9:16 縱向影片、重新設計的音訊聲碼器,以及從其重建的潛在空間中獲得的更銳利邊緣細節——這些改進是大多數競爭開源模型尚未匹敵的。
該模型支援哪些影片規格?
影片渲染最高可達 1080p HD,支援 16:9、9:16、1:1 和 4:3 縱橫比,時長從 4 到 20 秒,包括音訊同步輸出。LTX 2.3 是其系列中首款支援原生縱向 1080x1920 的模型,訓練於真實縱向數據而非裁剪的橫向數據。提示詞支援最多 2,000 個字元,用於詳細的場景描述。
LTX 2.3 是免費使用的嗎?
是的。在 ltx23.app 上的新帳戶會獲得免費積分來嘗試 AI 影片生成。之後,您可以購買額外積分或訂閱計畫以繼續創作。訂閱計畫為頻繁創作者提供批量折扣。
我可以將 LTX 2.3 的輸出用於商業目的嗎?
是的。在 ltx23.app 上生成的影片包含完整的 commercial 權利——無浮水印、無版權費。開源許可證也允許符合條件的組織將本地生成的輸出用於 commercial 用途,涵蓋廣告、社群媒體、廣播和印刷。
有哪些模型格式和工作流可用?
LTX 2.3 提供基礎檢查點、帶 LoRA 的蒸餾檢查點、FP8 縮放變體和 GGUF 量化格式。它直接整合到 ComfyUI 中,用於自定義工作流,包括首尾幀控制、空間升級器、深度條件和 IC-LoRA 運動跟踪。所有權重均可從 Hugging Face 下載。
如何開始使用 LTX 2.3?
在 ltx23.app 上建立免費帳戶,輸入描述影片的文本提示,可選上傳參考圖像或音訊,設置時長和縱橫比等參數,然後點擊生成。您的影片隨時可下載——無需影片編輯或 AI 專業知識。
如何使用 LTX 2.3
- 在 ltx23.app 建立帳號,取得免費配額並開始生成影片。
- 選擇生成模式:文字轉影片、圖像转影片或音頻轉影片。
- 輸入詳盡提示描述您想要的場景,確保不超過 2,000 個字符。
- 選擇影片參數,包括時長(4-20 秒)、寬高比(16:9、9:16、1:1、4:3)以及解析度(最高 1080p)。
- 點擊生成按鈕,耐心等待雲端處理完成您的影片。
- 下載已完成的影片,提供商業使用權且無水印。
