Z-Image Turbo (ZIT) 関連議論レポート
1. スレッド概要
- 主なトピック: Z-Image Turbo (ZIT) の登場とLoRA学習の実用性検証が中心。生成速度の速さ、軽量さ(6Bパラメータ)、VRAM効率の高さが評価され、SDXL後継候補としてコミュニティの熱量が高い。動画生成(PainterLongVideoなど)、プロンプト構造化技法、VRAM制約下の学習も活発に議論。CivitaiでZIT LoRAが急増中(»47, »107)。
- 期間/規模: ログは13〜234レス前後。ZIT公式のBaseモデル公開待ちの興奮が基調で、FLUX2/Qwenとの比較も。
- ユーザー層: ローカル環境ユーザー(RTX 3060/4070ti/5070ti/5090想定)。学習ツール(ai-toolkit, kohya/musubi-tuner)活用。
2. LoRA学習の検証結果
ZIT TurboでLoRA作成が即座に可能で、コミュニティが数日で検証を進める熱量が話題(»76, »92)。
| 検証例 |
環境/VRAM |
データセット |
ステップ/時間 |
結果/感想 |
| »35 |
4070ti SUPER (推定16GB) |
8枚画像, Danbooruタグ |
デフォルトプリセット |
30分弱で完了。速度標準的? |
| »55 |
5090 |
60枚, 1024x1024, タグのみ |
2400step |
1時間。背景再現向上、効きあり。 |
| »62-63 |
5070ti (16GB) |
5枚, タグ+自然言語 |
1000step (200エポック) |
1時間。特徴再現OK、16GB現実的。 |
| »74 |
未詳 (高速) |
未詳 |
5000step |
SDXL比2.4倍速, Lumina比1.8倍。Batch↑可能。画風ほぼ再現(ピンボケ注意)。 |
| »136,144 |
3060 (12GB) |
未詳 |
3000step |
6時間。SDXL比遅いが標準速度。 |
| »231 |
8GB (4bit量子化) |
XL素材そのまま |
500step |
1時間で効果。過学習早いが低スペック可。 |
- VRAM要件: 学習時13-14GB前後(»63,68,69,70)。12GBで可能だが時間長(オフロード/量子化推奨, »89,143)。8GBでも量子化で動作確認(»231)。Baseも同規模想定(»82)。
- ツール比較:
| ツール | 利点 | 欠点 |
|——–|——|——|
| ai-toolkit | 楽, 高速実装, タグ+自然言語OK | 容量食う (30GBモデルDL)。 |
| musubi-tuner (kohya後継) | BlockSwap実装, Base/Edit対応予定(»71,73)。 |
| sd-scripts | 未対応? |
- キャプション: タグのみ有効(»59)。自然言語併用推奨(»61,63)。テキストエンコーダー(VLM)的賢さで詳細不要(»100,113)。
- 注意: Turboは高速化チューン(蒸留LoRAマージ)、Base公開で作り直し推奨(»54)。画風LoRAはイラストFT待ち(»116)。
3. 生成/プロンプト技法のハイライト
- 構造化プロンプト有効: マークダウン/リスト記法(- , –)で位置/人物書き分け抜群(»154,167,169,216)。例:
```
- in the kitchen
- a girl – very short brown hair, huge breasts… – on the left
- a man – black long ponytail… – on the right
```
- 効果: 10枚中10枚指示通り(マークダウン)vs. 羅列で1枚(»167)。Danbooruタグ併用楽(»216)。
- JSON/XML/BREAKも有効推測(»206,221)。
- 複数キャラ: LoRA同時使用で可能(注意: キャプション重複NG, »178)。頭身/表情偏りは枚数不足。
- その他: RoLA機能確認(»165)。マークダウン普及で共有容易(»222)。
4. 動画生成関連
- ZIT+WAN2.2+MMAudio: 動画LoRA提案(»62)。
- PainterLongVideo: Native専用注意(»36,45)。ループ時は動き抑制、逆再生/FrameOverlapテク(»86,91,120,127)。
- リップシンク: Ovi/s2v/Infinite Talk(»37,41)。CFGブースト/Low切替で改善(»22,27)。
- 課題: VRAM余剰(»42,99)、モザイク自動化難(»86)。
5. 他モデル比較 & 将来展望
- 優位点: SDXL超軽量/高速(»52,64,66)。FLUX2重すぎ(»20,130,140)。Qwen後出し負け(»97)。
- 課題: エロFT待ち(»101,172,195)。Base/Edit公開待ち(»71,105)。イラスト/エロチューンで覇権(»80,133)。
- コミュニティ動向: Civitai ZITカテゴ急増(»47,107,171)。低VRAMアプローチ成功でボリューム層獲得(»172)。kohya実装期待(»156)。
- ハードウェア: 12GB脱落?(»90,136)。DDR5/メモリ高騰懸念(»58,121)。5090待ち(»104,141)。
6. 全体感想 & 示唆
- ポジティブ: 「軽いは正義」(»64,112,173)。トライ&エラー容易、参入障壁低(»106)。SDXL→ZIT移行気配(»96,158)。
- ネガティブ: Base待ち、VRAM格差、低スペック時間長。
- ゲームエンド論: 毎週訪れる(»187)。複数人/構図克服で進化(»193,201)。
- 推奨アクション: ai-toolkitでTurboLoRA作成→Base待ち。構造化プロンプト即活用。低VRAMは量子化/オフロード検証。
このログはZITの爆速普及を象徴。Base公開でさらに加速予想。詳細検証ログ(»63,74,231)参考に。