LTX 是什麼
LTX 是由 Lightricks 開發的即時 AI 影片生成模型,採用 20 億參數的 DiT(擴散變壓器)架構。它能在 2-4 秒內生成 5 秒、768x512 解析度、24 FPS 的影片,速度快於播放速度。該模型支援文字到影片與圖片到影片的生成,讓創作者能從描述性提示詞製作專業內容,或為靜態圖片製作動畫。
作為一個採用 Apache-2.0 許可證的開源項目,LTX 可與 ComfyUI 整合以實現可自訂的工作流設計,並運行在消費級 GPU 和 TPU 上。其快速的迭代循環適用於電影預演、廣告、社群媒體內容和教育教材等應用。輸出為標準 MP4 格式,便於在各大平台直接使用。此技術優先考慮效率與可及性,以實現無需傳統生產瓶頸的快速原型製作。
LTX 如何運作
LTX 是由 Lightricks 開發的即時 AI 影片生成模型,採用 2B 參數 DiT(擴散 Transformer)架構。其透過處理文字提示或輸入影像來產生短片片段,通常為 5 秒長、768x512 解析度、24 FPS。該系統生成輸出的速度快於播放速度,在 NVIDIA H100 等相容硬體上可在 2-4 秒內完成片段生成。它支援文字至影片和影像至影片的工作流,得以對靜態輸入進行動畫化。作為採用 Apache-2.0 License 的開源模型,LTX 可與 ComfyUI 等工具整合,目標應用包括快速原型設計、社群媒體內容和預可視化。
LTX 的優點
LTX 是首個即時 AI 影片生成模型,僅需 2 至 4 秒即可從文字或影像生成專業級影片。其基於 20 億參數的 DiT 架構,能在 768x512 解析度和 24 FPS 下實現生成速度快於即時播放。作為開源工具,LTX 與 ComfyUI 等平台整合,並支援文字到影片和影像到影片工作流。這種速度、品質和可及性的結合,使其適用於快速原型製作、社群媒體內容以及電影預演,為創作者提供高效的高品質影片製作方案。
LTX 的優點和缺點
優點
- 2-4 秒內生成 5 秒影片。
- 根據 Apache-2.0 許可證完全開源。
- 支援文字生成影片與圖像生成影片兩種輸入方式。
- 達成 768x512 專業解析度與 24 FPS 幀率。
- 可與 ComfyUI 整合以實現可視化工作流。
缺點
- 輸出解析度固定為 768x512。
- 本地部署需要技術配置。
- 僅能生成 5 秒的短片片段。
- 實時生成速度對 GPU 資源要求較高。
- 幀數受限於模型架構,數量有限。
