logoAIStage

LTX よくある質問

LTXは、クリエイター向けのDiTベースのAIビデオジェネレーターです。テキストまたは画像から数秒でプロフェッショナルなビデオを生成し、オープンソースの柔軟性を備えています。

ウェブサイトを訪問する

LTX の FAQ

LTX とは?何がユニークなのか?

LTX は Lightricks が開発した、DiT(拡散 Transformer)ベースの初のリアルタイム AI 動画生成モデルです。20 億パラメータのアーキテクチャを特徴とし、768x512 解像度、24 FPS の 5 秒動画をわずか 2-4 秒で生成可能で、再生速度を上回ります。完全にオープンソースで、テキスト動画生成と画像動画生成の両方をサポートしています。

LTX の生成速度は?

LTX は動画をリアルタイム再生より速く生成します。NVIDIA H100 GPU では、5 秒の動画を約 4 秒で生成可能です。この画期的な速度により、リアルタイムのクリエイティブワークフローや迅速なプロトタイピングが実用的となります。

LTX はどのような動画フォーマットと解像度をサポートしているか?

LTX は 768x512 解像度、24 FPS フレームレートの動画を生成します。モデルは、8 の倍数に 1 を加えたフレーム数(例: 9、17、25 フレーム)をサポートしています。出力は MP4 形式で、ソーシャルメディア、マーケティング、プロフェッショナルなコンテンツ制作に適しています。

LTX はオープンソースですか?

はい! LTX は完全にオープンソースで、Lightricks によって GitHub でホストされています。ComfyUI と統合され、視覚的なワークフロー設計を可能にし、GPU および TPU システムをサポートしています。開発者は Apache-2.0 ライセンスの下、自由に使用、修改、配布できます。

テキスト動画生成と画像動画生成とは?

テキスト動画生成により、テキスト説明から動画を作成できます——作りたいシーンを説明するだけです。画像動画生成により、静止画像をアニメーション化できます——写真をアップロードし、どのように動くべきかを説明します。LTX は一貫性のある高品質な結果で両モードを得意としています。

LTX のユースケースは?

LTX は、映画のプリビジュアライゼーション、広告クリエイティブ、ソーシャルメディアコンテンツ、教育資料、迅速なプロトタイピングに最適です。コンテンツクリエイター、マーケター、教育者、企業は、効率的にプロフェッショナルな動画コンテンツを制作するために使用しています。

LTX を実行するにはどのようなシステム要件が必要か?

LTX は十分な VRAM を備えた GPU を必要とし、NVIDIA H100 ハードウェアで最適な性能を発揮します。コンシューマー向け GPU と TPU システムをサポートしています。20 億パラメータのモデルは通常、ローカル実行に少なくとも 16GB の VRAM を必要とし、生成速度はハードウェア能力によって異なります。

LTX を始めるには?

新規ユーザーは、クレジットカード不要の無料クレジットを使用して、公式 ltx.dev ウェブサイトから LTX にアクセスできます。ローカル展開の場合、オープンソースモデルは GitHub で利用可能で、ComfyUI の統合ガイドが付属しています。Lightricks は、初期設定と探索を支援するためにドキュメントとサンプルワークフローを提供しています。

商業利用のライセンス条件は?

LTX は Apache-2.0 ライセンスでリリースされており、適切な帰属表示のもと、商業利用、修改、配布を許可しています。ライセンス料はありませんが、ユーザーはライセンス条項を遵守する必要があります。Lightricks はまた、FLUX.1 Kontext などのプロプライエタリモデルを別の商業ライセンスで提供しています。

LTX は他のクリエイティブツールと統合できますか?

はい。LTX はノードベースのワークフロー設計のために ComfyUI と統合され、他の AI モデルやエフェクトとの組み合わせを可能にします。MP4 形式の出力動画は、標準的な動画編集ソフトウェアにインポートできます。開発者はまた、独自のアプリケーションへのカスタム統合のために利用可能な API を使用することもできます。

LTX の現在の制限事項は?

LTX は現在、固定 768x512 解像度で動画を生成し、フレーム数は 9、17、25 フレームなどの特定の値に制限されています。高度に複雑または抽象的なプロンプトでは、一貫性が異なる可能性があります。リアルタイム速度はハードウェアに依存します。ハイエンド GPU で宣伝されている 2-4 秒と比較して、コンシューマー向け GPU では生成時間が長くなります。

LTXの使用方法

  • LTX は、20億パラメータのDiTアーキテクチャを使用し、テキストまたは画像入力から短视频を生成するリアルタイムAI動画生成モデルで、高速かつプロフェッショナル品質の結果を提供します。
  • LTXのWebインターフェース https://ltx.dev/ に移動し、サインインまたはアカウントを作成して、生成ツールとクレジットシステムにアクセスします。
  • 適切な生成モードを選択:「テキストから動画へ」は詳細なプロンプトに、「画像から動画へ」はアップロードした静止画にモーションプロンプトを追加してアニメーション化します。
  • 希望するシーン、被写体、動きを詳細に記述したテキストプロンプトを入力し、文字制限内で明確さを確保することで、最適な出力の一貫性を実現します。
  • 画像から動画への場合、ソース画像をアップロードし、動画の期間中に画像がどのようにアニメーションまたは変換されるかを指定するプロンプトと組み合わせます。
  • 生成プロセスを開始する前に、ターゲットプラットフォームの要件に合ったアスペクト比(例:16:9、9:16)を選択します。
  • 「動画を生成」ボタンをクリックします。システムは指定されたクレジット(例:10~15)を消費し、Seedream 5.0モデルを使用してリクエストを処理します。
  • 5秒、768x512解像度のMP4動画がレンダリングされるまで約2~4秒待ちます。LTXはリアルタイム再生速度よりも高速に動作します。
  • インターフェースで生成された動画を直接プレビューし、画質、動きの滑らかさ、入力プロンプトまたはソース画像との整合性を評価します。
  • 最終的なMP4ファイルをダウンロードし、編集ソフトウェア、ソーシャルメディア、プレゼンテーション、またはその他のクリエイティブおよびプロフェッショナルな動画制作ワークフローで使用します。
  • プロンプトの調整、アスペクト比の変更、ソース画像の修正を繰り返して結果を洗練させ、ツールの高速性を活用した迅速なプロトタイピングを行います。
  • 生成されたクリップを、ソーシャルメディアコンテンツ、広告ストーリーボード、教育用クリップ、映画のプリビジュアライゼーションなどの特定のユースケースに適用します。
特徴*

LTX 代替案