抽出された生成AIモデルに関する話題
ログ全体をスキャンし、指定モデル(NovelAI (NAI), Pony, illustrious(イラストリアス, リアス,ill,IL), Noobai, FLUX, Wan, Qwen)に関する言及をすべて抽出。Pony と FLUX は一切言及なし。以下、各モデルごとに該当レス番号と内容をまとめ、特に選ばれている理由や利点・欠点が明記されている箇所を太字で強調。
NovelAI (NAI)
- 615: 「初めて画像参照が役立った気分。絶対naiちゃんの知らない男の娘」
→ NAIの生成画像(男の娘)が珍しい・知らないものを出力した点で好印象(画像参照機能の有効性)。
illustrious (イラストリアス, リアス, ill, IL)
- 481: 「step数もどこが適正かよう分からんままや リアス系+eulerAとかはseedガチャでごまかせるから18stepとかでも充分に感じる」
→ リアス系 + Euler a がseedガチャで調整しやすく、少ないstep(18step)で十分な品質が出るため選ばれている。
- 578: 「z-imageはリアスでは難しかった身長差もちゃんと指示通りになってくれるやね 構図的に難しいときはあかんけど」
→ Z-Imageでリアス(illustrious?)使用時、身長差の指示が通りやすい利点。ただし構図次第で難あり。
Noobai
- 526: 「何やらBASEは「数週内」って開発がdiscordで言ったらしい noobのデータゲットして今トレーニング中だったらええなぁ」
→ Noobai(noob)のデータ取得・トレーニング中の話題。リリース待ちの文脈で期待。
Wan
- 517: 「前のスレにあったsafetensor ではなくてgguf ならメインメモリ食わないってやつはほんとなん? それならwan2.2でもfp16のgguf 版作ってつかったら頑張ってram128Gとか積まなくていいってこと?」
→ Wan 2.2でGGUF版使用時、メインメモリ(RAM)消費を抑えられる可能性を期待(ハードウェア要件軽減)。
Qwen
Qwen関連の言及が最多。主にQwen2509, Qwen Image Edit (QIE), Qwen3-VL-8B-NSFW-Caption-V4.5, QwenVL-NSFWなどの派生モデル・ツール。
- 493: 「SD1.5やSDXLではずっとDPM++ 2m karrasにお世話になっとるけど、qwen2509とか新モデルでは採用されんのって何か理由あるん?」
→ Qwen2509(新モデル)で従来サンプラー(DPM++ 2m karras)が採用されない理由を疑問視。
- 515: 「QIEの新しいやつはいつ出るんです 十分今でも高性能やけど」
→ QIE(Qwen Image Edit)がすでに高性能で新版待ち。
- 520: 「qwenもzimageもはよ出せや牽制しあってんじゃねえ」
→ Qwenリリース待ちの苛立ち(Z-Imageとの競合)。
- 564: 「推奨モデル: Qwen3-VL-8B-NSFW-Caption-V4.5.Q6_K.gguf 画像生成フローに組み込んでいるためauto_unloadはTrue(生成時間は数秒長くなるがこれをしないと後工程の画像生成段階で詰む)」
→ 画像キャプション生成に推奨。GGUF版でVRAM管理しやすく、NSFW対応。auto_unload=Trueで後工程安定(生成時間微増のトレードオフ)。
- 572: 「ZITで使う場合はモデルやテキストエンコーダーに貧乳出力する能力があんま無さそうのがネックやが」
→ ZIT(Z-Image-Turbo)でのQwen系モデル、貧乳出力が苦手な欠点。
- 576: 「出力された絵はchatGPTっぽい画風やがローカルやからz-image?いやqwenなんかな?」
→ 生成画風がQwen由来の可能性。
- 579: 「Z-Image-Turboのプロンプトぢからを試してみたで 1枚目の画像からQwen3-VL-8B-NSFW-Caption-V4.5 4bitでプロンプトにして生成や GGUFやったらさらに精度が上がるはずやで」
→ 画像からプロンプト自動生成にQwen3-VL-8B-NSFW-Caption-V4.5(4bit)使用。GGUFで精度向上期待。
- 588: 「MMDなりコイカツなりで3P構図を作る → Qwen image editでイラスト化する QwenVL‐NSFWでキャプション Zimageのエロチューンで生成」
→ 構図イラスト化にQwen Image Edit、キャプションにQwenVL-NSFWを使用(ワークフロー統合)。
- 618: 「RTX5060Ti導入したからQwenをこれ通りやったけど 砂嵐みたいなモザイクかかってる画像しか生成されないんやけどなんでなんやろか…」
→ Qwen生成でモザイク・砂嵐問題発生(RTX5060Ti環境)。
- 619-620: 「fp8モデルやったらそれが原因、fp8モデルはなんかノイズまみれになったとかそういうのばっか聞く」「モデルqwen_image_distill_full_fp8_e4m3fn.safetensorsやわ」
→ FP8版(qwen_image_distill_full_fp8_e4m3fn)がノイズ・砂嵐の原因。
- 630: 「bf16がいいよ」
→ QwenでBF16版を推奨(FP8問題回避)。
- 637: 「なんんかとしあきのやつみたらQwenはVRAM16Gだと量子化のやつまで落とさないと牛歩になるって書かれてるけどそうなんか」
→ VRAM16GB環境では量子化必須でなければ低速(牛歩)になる欠点。
まとめ洞察
- Qwen が最多言及で、画像編集・キャプション生成・NSFW用途で積極活用。利点: 高性能、GGUF/BF16でメモリ効率良し、プロンプト自動化。欠点: FP8でノイズ、VRAM食い、特定出力(貧乳)弱い、低速リスク。
- リアス系 は少ないstep・seed調整で実用的。
- Wan/NAI/Noobai は周辺話題中心で、メモリ効率やリリース待ち。
全体として、サンプラー(Euler a)と組み合わせた実用性やハードウェア互換性が選定理由のキーワード。追加質問があれば уточните。
抽出された生成AI「モデル」に関する話題
ログ全体から、生成AIのモデル(主に画像生成モデル)を指す言及を抽出。除外リスト(NovelAI (NAI), Pony, illustrious(イラストリアス, リアス,ill,IL), Noobai, FLUX, Wan, Qwen)のモデル/ツールは完全に除外。サンプラー(Euler a, DPM++ 2M Karrasなど)やスケジューラー、LoRA、VAEなどの周辺要素は「モデル」本体ではないため除外。ハードウェア(RTX5060Tiなど)や対話型AI(Gemini, Grok, ChatGPTなど)も対象外。
抽出基準:
- 明確にモデル名が登場し、生成性能/使用/理由などが議論されているもの。
- 主なモデル: SD1.5, SDXL, Z-image系(Z-image, Z-Image-Turbo/ZIT, Z-image-Baseなど。Z-imageは頻出の独自/新モデルとして扱われ、リアス系などとの比較で性能が語られる)。
1. SD1.5 / SDXL (493)
- 内容: 「SD1.5やSDXLではずっとDPM++ 2m karrasにお世話になっとるけど、qwen2509とか新モデルでは採用されんのって何か理由あるん?」
- 話題: SD1.5/SDXLでDPM++ 2M Karrasサンプラーが長く使われており、信頼性が高いことを示唆。新モデルとの比較で、SD1.5/SDXLのサンプラー互換性が優位。
- 選ばれている理由: 明示なし(「お世話になってる」=安定・常用性が高い)。
2. Z-image / Z-image系 (複数箇所: 463, 516, 517?, 541, 557?, 576, 578, 579-581, 583, 586-589)
- 内容例:
| ログ番号 | 抜粋 |
|———-|——|
| 463 | Z ImageのControlnet出てたわ |
| 516 | QIEの新しいやつはいつ出るんです 十分今でも高性能やけど / Z-imageEditの出方を伺っており |
| 541 | Z-Image-Base To be released |
| 576 | この画像はよく見たら… z-image? |
| 578 | z-imageはリアスでは難しかった身長差もちゃんと指示通りになってくれるやね |
| 579 | Z-Image-Turboのプロンプトぢからを試してみたで |
| 580 | zimageだけど生成されたキャプション以外のプロンプトは入れてない / ZITなんやな |
| 581 | Z-imageでリアスi2i用の下絵って作れるか? |
| 586 | Z-imageは毎回毎回ちゃんと言語でプロンプト組んでたらキリないし |
| 587 | SDXLよりは圧倒的にマシだけど人体の交差はやっぱ難易度高い印象 |
| 588 | ZimageのエロチューンのLoRA作成、Zimageのエロチューンで生成 |
- 話題: Z-image / Z-Image-Turbo (ZIT) / Z-image-Base / Z-imageEditのControlNet対応、リリース待ち、高性能さ、プロンプト/構図生成(身長差、人体交差、i2i下絵、漫画)、リアス系モデルとの比較で優位(身長差再現、SDXLよりマシ)。エロチューンLoRA作成やプロンプト生成との連携。
- 選ばれている理由:
- 高性能でControlNet対応(463)。
- リアス系で難しかった身長差が指示通り再現(578)。
- SDXLより人体交差がマシ(587)。
- タイパ(時間効率)良く、プロンプト/LoRA/編集との相性抜群(579-581, 583, 588)。
- 漫画生成や新規構図作成に強い(584, 589)。
3. リアル系モデル (504)
- 内容: 「リアル系モデルやと穴が閉じててキュプリッなんやけど WAI等で生成すると貫通はしてなさそうやけど穴がデカくなるんや。そこでこのLoRA適用して閉じ気味なのを選別し アニメ・イラスト調でも上手く穴が閉じるLoRAを再学習させようと思うんやけど」
- 話題: リアル系モデルの生成特性(穴の閉じ方)がLoRA再学習の課題として議論。
- 選ばれている理由: 明示なし(実写学習元由来のリアル質感が強みだが、NSFW生成で穴表現が課題)。
追加洞察
- Z-image系が最多: ログ後半でZ-imageファミリー(Turbo/Base/Edit/TIT)が熱く語られ、ComfyUI連携や他モデル比較で「高性能」「リリース待ち」「実用性高い」と好評。除外リスト外のため全抽出。
- 全体傾向: SD1.5/SDXLはベテラン常用モデルとして安定感。Z-imageは新興モデルとして革新性(構図/身長差/ControlNet)が理由で注目。
- 抽出外理由例: Qwen系(493,515-520,564,576,579,618-620,630)は除外。WAI(504)はWan除外。fp8/bf16(619-620)はQwen固有。LoRA/VAEはモデル本体でない。