Z-Imageスレッドレポート(なんJ(5ch)ログ: 232-435)
1. スレッド概要
- 期間/規模: ログは232レスから435レスまでの約200レス。Z-Image(Z-Image-BaseおよびTurbo)のリリース直後と思われる熱い議論。主にAI画像生成(Stable Diffusion系)の愛好家が集まり、性能評価、使いこなし、LoRA学習、ハードウェア対応を中心に語られる。
- 全体雰囲気: 興奮と実践報告が中心。ベースモデルとしてのポテンシャルを高評価する声多数だが、エロ生成の粗さや日本語プロンプトの弱さを指摘するクレームも。コミュニティの結束が強く、作例共有、Tips交換、将来モデル(Lightning/Turbo LoRA、石油王待ち)が活発。「ベースモデル同士で評価せよ」「大規模学習で化ける」との楽観論が主流。
- キーワード: Z-Image, LoRA学習, euler+beta57/simple, 自然言語プロンプト, 逆光/肌描写, VRAM12GB, 石油王(中東王族の資金援助願望)。
2. 主な性能評価と比較
| 項目 | 評価ポイント | 比較対象 |
|——|————-|———-|
| 解像度/高解像度対応 | 1024x1024安定、1088x1920/2048x2048ポン出し可能。アプスケなしで破綻耐性高(susamixEX v3で実証)。256x256/512x512グリッドでスタイル差異確認。 | SDXL/Pony/Rias: 高解像度で劣る。Z-Image優位。 |
| 画質/描写力 | 構図/配置強いが、指/手/腕崩れやすい。肌は公式テンプレでまだら→euler+beta57で綺麗に。エロはザラザラ/低解像度感(sage attentionオフでも)。脱肛気味だが具ありマン描ける。 | SDXL: 肌/陰影劣る。Rias/Noob: イラスト系で互角以上。NAI v5待ち。 |
| プロンプト対応 | 自然言語強い(danbooruタグも一部効く)。日本語まあまあ(漢字/西夏文字弱)。強調: gigantic/huge効くが、(タグ:1.3)はCLIP遺産で無効。ネガティブプロンプト有効(逆光: back/side lighting)。 | SD1.5: クオリティタグで絵柄激変。部族語(danbooru/e621)最強論。 |
| 生成速度 | 3060ti/12GBで1-2分/枚。Turbo/Lightning待ち。fp8/fp4量子化で微改善。 | Flux/Qwen: 重い。Z-Image軽量優位。 |
| エロ/NSFW | 出力ザラザラ、乳首省略/逆光多発。LoRAで阻止可能。自然言語で体位把握弱。 | Pony: 背景力で劣る。エロ特化FT待ち。 |
- 作例共有ハイライト:
-
261: susamixEX v3(SDXLマージ、2048x2048ポン出し)。
-
295: サンプラー比較グリッド(euler+simple最強)。
-
360: Z-Image LoRA初回(イラスト自然言語複数キャラ)。
-
397: スタイルプロンプトグリッド(解像度依存)。
-
418: LTX-2 Image2Videoリップシンク(アニメ系)。
3. 最適設定/Tips共有
- サンプラー/スケジューラ: euler+beta57/simple/res_multistep+simple最強。steps:28-30重いが綺麗。CFG:3.5, shift:2.0。
- プロンプト工夫:
- ポジ: “ultra detailed aesthetic masterpiece anime style…” + front lighting。
- ネガ: (back lighting, side lighting, edge lighting:-1), shade/sidelighting。
- 強調: gigantic breasts, extremely huge(繰り返し/修飾語)。比喩(スイカ乳)NG。
- 部族語推奨: 1girl, large breasts > 自然言語。
- LoRA学習:
- 解像度: 素材そのまま(1536)or小→大。学習率:5e-4→4e-4, dim:16→12, epoch:20→36, shift:2.2→3.3。
- ツール: ai-toolkit安牌, musubi-tuner変?。キャプション: 自然言語+トリガー。
- 課題: 9時間回してもloss不安定。Z-Imageベースで高速化LoRA期待。
- 環境対応:
- WebUI/Forge Neo/ComfyUI即対応。Tiled Diffusion? fp8 GGUFあり。
- VRAM12GB: 生成OKだがCUDA60%で遅(160s)。4080Sで15h学習。
- OS: Win11で性能向上。
4. 問題点と解決/批判
- 課題:
- エロ粗(ザラザラ/乳省略/逆光)。日本語弱(Qwen2.5 3B/4B限界)。
- Turbo: 解像度微妙。Base: アーティファクト/3D感。
- ハード: 5090+128GB待ち(100万超)。
- 解決策: 人力キャプション確認スクリプト、ネガpip、LoRA/FT待ち。
- クレーム対応: 「負のフィードバック」「作者に文句」vs「乞食黙れ」。ポジティブ多め。
- 将来展望:
- Lightning LoRA(lightx2vコレクション)、ai-toolkit Turbo LoRA着手。
- 大規模学習(SDXL超えエロ)/石油王資金/NAIv5競合待ち。
- 進化路: Z-Image→Lumina2→SDXL? ベース同士評価論。
5. コミュニティ洞察
- ポジティブ: 「軽さ/構図最強」「高解像度革命」「作例ガチャ楽しい」。世界樹ニキ/球体ニキ等リーダー格活躍。
- ネガティブ: 「SDXLで十分」「Flux/SD3微妙続き」「技術ついていけん」。
- トレンド: 自然言語移行中だが部族語回帰。LLM(QwenVL/GPT)でプロンプト生成実験。Edit機能/3D結合期待。
- ユーモア: 石油王メール、スペルミス祭り(bleasts)、「ボン・キュッ・ボン!」。
このスレはZ-Imageの「ベースモデル」としてのポテンシャルを強調し、LoRAエコシステム構築の過渡期を象徴。1-2週間でエロ/アニメ特化モデル群がCivitaiに溢れそう。次スレ期待。