Z-Image関連なんJスレッドレポート(抜粋ログ分析)
1. スレッド概要
- 対象ログ: 投稿4〜231(主にZ-Image/ZI/ZIT/baseモデルに関する議論)。
- 主なテーマ: 新リリースされたZ-Image(ZI、ZIT、baseモデル)の評価、LoRA学習環境構築、ComfyUI設定、ハードウェア要件、エロ用途の期待と課題。Turboモデルとの比較が頻出。コミュニティは興奮と試行錯誤の段階で、SDXLからの移行を検討中。
- 参加者傾向: AI画像生成愛好家(ローカルユーザー中心)。VRAM12GB〜16GBユーザー多数で、低スペック対策が活発。エロ/アニメ特化の話題が半数以上を占める。
- 全体ムード: 期待高く「新時代」「SDXL要らん子化」などのポジティブ意見多数。一方、生成速度/VRAM不足/LoRA互換性の不満も目立つ。喧嘩(MultiGPU論争)あり。
2. 主なトピックと議論ポイント
2.1 Z-Imageの特徴と評価
- 強み:
- 自然言語プロンプトの理解力向上(MD形式指定可能: e.g., 「A chubby man with black hair – playboy bunny – V sign」)。タグ依存のSDXLより構図/ポーズ/複数キャラ指定が優秀(»179, »46, »92)。
- 背景/服装/シチュエーションの再現性高(ショッピングモール、雪景色などSDXLで苦手なものが楽勝: »90, »117)。
- アニメ/実写混合可能、コントラスト/詳細描写向上(骨付き肉のクオリティ例: »118)。
- 品質: Turboより上(イラスト系特に)。実写はZIT優位(»86, »88)。
- 弱み:
- 生成速度遅(1024x1024/step28で40秒〜2分、3060で1枚2分超: »103, »225)。Turboはステップ短縮蒸留版で別物(»101)。
- ノイズ発生(sage attentionオンが原因: »154〜155, »163)。
- エロ概念弱(下着/裏返しパンティ出にくい、調教必要: »74, »76, »153)。
- 整合性問題(ありえない配置/矛盾: »62)。
- 解像度Tips: 1296x1728直生成 > 832x1216+x1.5アプスケ(崩れにくい: »221)。
2.2 LoRA学習環境
- ツール: ai-toolkit主流(qwen時はmusubi tunerと半々: »61)。初期設定で1024解像度/VRAM15GB(1536は24GB必要: »23)。50枚/batch4/300stepで1時間(3090: »150)。
- 時間/スペック:
| スペック | 学習時間例 | 備考 |
|———-|————|——|
| 3090 (24GB?) | 1時間 (50枚/300step) | 画風LoRA失敗例 |
| 5070Ti (16GB?) | 3.5s/it (1024) | SDXLの3.4倍時間だが実用 |
| 12GB VRAM | blockswap/musubi tunerで1536可 (10GB未満: »53) |
- 課題: キャプション工夫必要(VLM/QwenVL/WD推奨: »215, »216)。トリガーワード単独で人体破綻(»212)。ZIで作ったLoRAはZIT/Turbo互換性なし(»64, »66)。
- 成功報告: 童貞卒業多数(日本語通じる: »206)。Unetのみ学習で二次元強化可(»219)。
2.3 ハードウェア/ComfyUI設定
- VRAM要件:
- 12GB: 出力可(foooocus/Comfy: »37)。bf16+RAM32GBで30step遅め(»38)。MultiGPUノードで安定(»162)。
- 16GB: 主流スタートライン(»32, »35)。ZImage本格化で幕開け予感。
- 低スペ: gguf/8GB+32GBで10分/枚(»169)。RAMオフロード推奨(wanみたいに: »33)。
- ComfyUITips:
- sage attentionオフ推奨(ノイズ回避: »154, »160)。
- MultiGPU論争(DistorchmultiGPU非推奨/不安定: »172〜204)。公式テンプレでbf16可。
- TextEncodeZImageOmniノード: Base/Omni別モデル?(»129)。
- 高速化待ち: noobチームFT、zuntan、高速化LoRA(»34, »105)。
2.4 Turbo/Base/ZI関係
- ZIB→ZI名称変更(base非お蔵入りで安心: »21, »30)。
- Turbo: 速度特化(品質低め、特にイラスト)。ZI: 品質/知識上(»47, »101)。
- 移行期待: SDXLパターン化/構図限界指摘(»50〜52)。ZIで下絵→NAI i2i(»45)。
2.5 エロ/アニメ用途期待
- エロ特化: 複数キャラ/性癖構図(ローアングルPOV)優秀(»49, »57)。背景blurry推奨(»80)。
- 課題: エロ概念未学習(»67, »76)。noob/pony系エロFT待望(»119, »137)。クローズド化懸念(»126)。
- アニメ: プロンプト追加例「in anime style…」(»11)。ZIE編集期待(»83)。
- 企業FT: TENGA/AliBaba妄想(»145〜147)。
2.6 将来展望/懸念
- 期待: ZImage Pony/Noob/ILLエロモデル(»189, »231)。高速化/自然言語ノウハウ蓄積(»68, »208)。
- 懸念: 学習コスト高(億単位: »131)。クラファン詐欺/オープン化(»125, »138)。低スペ足切り(»35)。
- 他: 動画(t2v? »107)、AIオナホ連動妄想(»148)。
3. ユーザー反応統計(大まか)
- ポジ: 60%(「敷居低い」「期待持てる」)。
- ネガ: 30%(速度/VRAM/エロ弱)。
- 中立/Tips: 10%(設定共有)。
4. 結論と今後予測
Z-ImageはSDXL超えのポテンシャルでコミュニティ沸騰中だが、速度/エロ最適化が鍵。LoRA/noob系派生モデル出現でローカルエロ帝国化加速予想。低スペユーザー向け軽量化(bf16/RAM活用)が進む。スレ継続でノウハウ共有活発化必至。次スレで「ZImage Noob実況」「エロLoRA祭り」増加か。