logoAIStage

LTX 2.3 常见问题解答

这款AI视频生成器提供文本转视频、图像转视频和音频转视频的创作功能,采用开源的LTX 2.3模型,搭载22B参数的DiT引擎,可实现电影级的输出效果。

访问网站

LTX 2.3 的常见问题解答

LTX 2.3 是什么?

LTX 2.3 是由 Lightricks 基于 Diffusion Transformer (DiT) 架构构建的 220 亿参数开源 AI 视频模型。它支持文本到视频、图像到视频、音频到视频和视频到视频生成,具备原生纵向输出、重建的 VAE 以及 4 倍扩展的文本连接器,以实现更精确的提示解释。模型权重在 Hugging Face 上提供,适用于开发版和蒸馏版检查点。

我需要强大的 GPU 或本地桌面设置吗?

不需要。在 ltx23.app 上,所有渲染都在云端进行——无需本地 GPU、VRAM 或桌面安装。如果您偏好本地运行,LTX 2.3 支持 ComfyUI 工作流和 GGUF/FP8 量化格式以降低硬件要求。推荐的本地配置是 NVIDIA GPU,配备 32 GB+ VRAM、32 GB RAM 和 Windows 系统上的 60 GB 存储空间。

LTX 2.3 与 WAN 2.2 等其他视频模型相比如何?

在 H100 GPU 上,LTX 2 系列的吞吐量约为 WAN 2.2 14B 的 18 倍,使其在批量渲染方面显著更快。LTX 2.3 还引入了原生 9:16 纵向视频、重新设计的音频声码器,以及从其重建的潜在空间中获得的更锐利边缘细节——这些改进是大多数竞争开源模型尚未匹敌的。

该模型支持哪些视频规格?

视频渲染最高可达 1080p HD,支持 16:9、9:16、1:1 和 4:3 纵横比,时长从 4 到 20 秒,包括音频同步输出。LTX 2.3 是其系列中首款支持原生纵向 1080x1920 的模型,训练于真实纵向数据而非裁剪的横向数据。提示词支持最多 2,000 个字符,用于详细的场景描述。

LTX 2.3 是免费使用的吗?

是的。在 ltx23.app 上的新账户会获得免费积分来尝试 AI 视频生成。之后,您可以购买额外积分或订阅计划以继续创作。订阅计划为频繁创作者提供批量折扣。

我可以将 LTX 2.3 的输出用于商业目的吗?

是的。在 ltx23.app 上生成的视频包含完整的商业权利——无水印、无版权费。开源许可证也允许符合条件的组织将本地生成的输出用于商业用途,涵盖广告、社交媒体、广播和印刷。

有哪些模型格式和工作流可用?

LTX 2.3 提供基础检查点、带 LoRA 的蒸馏检查点、FP8 缩放变体和 GGUF 量化格式。它直接集成到 ComfyUI 中,用于自定义工作流,包括首尾帧控制、空间升级器、深度条件和 IC-LoRA 运动跟踪。所有权重均可从 Hugging Face 下载。

如何开始使用 LTX 2.3?

在 ltx23.app 上创建免费账户,输入描述视频的文本提示,可选上传参考图像或音频,设置时长和纵横比等参数,然后点击生成。您的视频随时可下载——无需视频编辑或 AI 专业知识。

如何使用 LTX 2.3

  • 在 ltx23.app 上创建账户,获取免费积分并开始生成视频。
  • 选择生成模式:文本转视频、图像转视频或音频转视频。
  • 输入详细提示描述您所需的场景,确保不超过 2,000 个字符。
  • 选择视频参数,包括时长(4-20 秒)、宽高比(16:9、9:16、1:1、4:3)以及分辨率(最高 1080p)。
  • 点击生成按钮,等待云端处理完成您的视频。
  • 下载已完成的视频,拥有商用权利且不含水印。
精选*

LTX 2.3 替代品