抽出結果: 指定モデルに関する話題
ログ(232〜435)から、指定されたモデル(NovelAI (NAI), Pony, illustrious(イラストリアス, リアス,ill,IL), Noobai, FLUX, Wan, Qwen)に関する言及をすべて抽出。該当レス番号、内容の要約、選ばれている理由(明示的なもの)を記載。各モデルごとに整理。
NovelAI (NAI)
- 255: Zimage-NoobよりNAIv5の方が早く来そうな気はする
→ NAI v5のリリースがZ-Image-NoobAIより早い可能性を指摘(比較による言及)。
- 382: ローカルのNAIは一応あるで…
→ ローカル環境でNAIを使用可能と述べる(所有確認)。
選ばれている理由: なし(主にZ-Imageとの比較で言及)。
Pony
- 239: sdxl, pony, リアスしかり「無印モデルで生成するとなんやこれは・・・」やったけどz-imageはそこそこいける
→ Ponyの無印モデル生成が不満(「なんやこれは・・・」)と比較し、Z-Imageを評価。
- 424: ponyの頃と違って背景力は最初からあるから純粋に人物のディティール詰めればええやんな
→ Pony時代と比較し、Z-Imageの背景生成力が優れている点を指摘(Ponyの過去使用を想起)。
選ばれている理由: Ponyの無印モデルが生成品質で不満(ぼんやりした出力)。背景力が弱かった過去の経験からZ-Imageを好評価。
illustrious (イラストリアス, リアス, ill, IL)
- 235: »231 リアスは知らんがnoobは散々話出とるやろ
→ リアスを知らないが、NoobAIの話題が多いと指摘。
- 239: sdxl, pony, リアスしかり「無印モデルで生成するとなんやこれは・・・」やったけどz-imageはそこそこいける
→ リアスの無印モデル生成が不満(「なんやこれは・・・」)と比較。
- 286: 絵柄自体はリアスで文句ないんやが、肌テカらせると陰影つけるためかひたすらに逆光になるんをzimageで解決して欲しいンゴ
→ リアスの絵柄は満足だが、肌テカリ時の逆光問題をZ-Imageで解決希望。
- 293: うーんZ-baseは構図はいいんやが画質は良くないしアーティファクトは出るしエロはムリだしでしばらくはまだリアスに頼ったままになりそうやな
→ Z-Imageの欠点(画質、アーティファクト、エロ生成不可)を挙げ、リアスに継続依存。
- 331: とりあえず出来るのは分かったし可能性は見えたけど 今日一日ちょっと遊んで満足したからリアス戻るかなって感じ
→ Z-Imageを試した後、リアスに戻る意向。
- 396: 手がとか腕が崩れやすいのは困りものやが明確にキャラの出し分け出来るのとリアスよりも高解像度が安定して出せるのはいいな
→ Z-Imageの高解像度安定性をリアスより優位と評価(リアスは高解像度で不安定?)。
選ばれている理由:
- 絵柄満足(286)。
- Z-Imageのエロ/画質不足で依存継続(293)。
- 高解像度安定でZ-Imageに劣る(396)。
- 全体的に無印生成不満だが、信頼性が高く戻りやすい(239,331)。
Noobai (NoobAI, noob)
- 235: »231 リアスは知らんがnoobは散々話出とるやろ
→ NoobAIの話題が頻出と指摘。
- 237: turboが出た時にZ-Image公式がLaxharにNoobAIのデータセットを使わせてほしい言ってて アニメチューンモデルが出ると憶測が出たけど、あの話はどうなったんだろうか
→ NoobAIのデータセットがZ-Image turboで使用希望され、アニメチューン憶測。
- 255: Zimage-NoobよりNAIv5の方が早く来そうな気はする
→ Z-Image-Noob(NoobAIベース?)とNAI v5を比較。
選ばれている理由: なし(主に過去話題やデータセット利用の文脈で言及)。
FLUX
- 254: SD3は微妙過ぎたけどFlux1の時もQwenImageの時も聞いた
→ Flux1時に「大規模学習でエロ絵改善」論が散々出たが実現せずと批判。
- 259: Flux1はライセンス問題あります→Qwenでライセンス問題無くなりました→Qwenでは結局重すぎました→Z-imageで軽くしました
→ Flux1のライセンス問題を起点に進化経緯を説明(Flux1はライセンスで不採用)。
選ばれている理由: なし(ライセンス問題で進化の障害として言及)。
Wan
- 323: 久々にnativeでwan触ったけど勝手にlowVramモードになったり99%で張り付いてramに逃がしたりデコードでoomしたら勝手にtiledに切り替わったりすげーな
→ Wanの動作(VRAM最適化)を評価。
- 355: Wan2.2のときに貧乳着衣→おっぱい見せのときに胸を盛るなのときにあった 「small breasts」はなんか効きがいまいち…効くのは「child」だったというね
→ Wan2.2のプロンプト挙動(胸サイズ指定の難しさ)を例に挙げる。
- 418: WAN2.2 Infinite Talk(painterAI2V)もまあまあいいけどLTX-2のほうがリップシンクに関してはよかった
→ WAN2.2のAI2V(Infinite Talk)でリップシンクを評価(LTX-2より劣る)。
選ばれている理由: VRAM最適化機能が優秀(323)。ただしプロンプト指定の難しさあり(355)。
Qwen
- 233: NSFWQwenVL任せで画像と整合性取れてないキャプションをLoRA学習させると強烈なノイズになるから、やっぱ人力目視確認は必要
→ NSFWQwenVLのキャプション整合性不足でLoRA学習時のノイズ問題。
- 257: zimageでもエンコーダーはqwen3 4Bで変わらんよな 4Bじゃ日本語の理解度がなあ
→ Z-ImageのエンコーダーがQwen3 4Bで、日本語理解不足。
- 259: Flux1はライセンス問題あります→Qwenでライセンス問題無くなりました→Qwenでは結局重すぎました→Z-imageで軽くしました
→ Qwenはライセンス解決したが重すぎてZ-Imageへ移行。
- 311: ここ任意で変えられたら嬉しいよな 調べてるとLLMのサイズ変えるとLLM出力側のhiddensizeも変わるから… qwen_3_4b
→ Qwen_3_4Bのサイズ変更希望(日本語性能向上のため?)。
- 319: 「clip_l」や「clip_g」は…「qwen_3_4b」と並列概念… ComfyUIのClipの読み込みノードでqwen_3_4bを読み込んでる
→ Qwen_3_4Bをテキストエンコーダとして使用(CLIP代替)。
- 414,422: QwenVLに画像読み込ませてプロンプト化(表情/エロ描写)。脱獄プロンプト使用。
→ QwenVLで画像分析→プロンプト生成(エロ厳しいが脱獄で対応)。
- 427: 中華LLMは脱獄ユルユルやがエロ自体をあまり学習しとらんのや
→ Qwen系(中華LLM)のエロ学習不足。
選ばれている理由:
- ライセンスフリー(259)。
- Z-Imageのエンコーダとして使用(257,311,319)。
- VL版で画像→プロンプト変換に活用(414,422)。
- 欠点: 重い(259)、日本語理解不足(257)、エロ学習薄い(427)、キャプション不整合(233)。
全体補足: ログの主テーマはZ-Imageだが、これらモデルは主に比較対象・過去使用・欠点指摘として登場。選定理由はZ-Image優位性を強調するためのものが大半。
生成AIモデルに関する話題抽出(除外モデル除く)
ログ全体から、除外リスト(NovelAI/NAI, Pony, illustrious/リアス/ill/IL, Noobai, FLUX, Wan, Qwen)のモデル・ツールを除外し、生成AI「モデル」に関する言及を抽出。主にZ-Image(ZI, z-image, Z-base, Z-Image-turbo, Z-Image-Base GGUF, zit turboなど)が中心で、ベースモデルとしての評価・比較が最多。他にSDXL、SD1.5、SD3、Lumina2などが散見。選ばれている理由(利点・欠点含む)を可能な限り抽出・強調。
Z-Image(主な話題源、ベースモデルとして頻出)
- 軽量・高速生成の売り(理由: 学習含め軽さが強み、VRAM12GBでも生成可能、低スペック対応): »256「軽さが売り」、»258「4060ti 16GBで1分30秒」、»292「12GBで生成問題ないがCUDA60%しか使わず遅い(160s)、fp8で速度期待」、»296「Turboはこの解像度で綺麗」、»410「ポン出し40秒で高品質」。
- ベースモデルとしてのポテンシャル高(大規模学習期待、LoRA/FT待ち): »239「無印でそこそこいける、二次/三次特化学習嬉しいが感謝」、»246「ベースモデル同士でSDXL比較、Z-Imageに大規模学習させたらSDXL超え!?」、»254「大規模学習でSDXL超えエロ期待(過去Flux/Qwenでも言及)」、»285「ベース扱い、LoRA/蒸留LoRA来たら変わる」、»430「ai-toolkit作者がZIターボLoRA着手」。
- 解像度・耐性の強さ(理由: 高解像度安定、アプスケ耐性抜群): »277/278/361「2048x2048破綻せず凄い」、»282「1024x1024解像度足りない、1.5MP欲しい」、»305/308「512x2048」、»374「1088x1920素で生成」、»386「アップスケール耐性半端ない」、»396「高解像度安定」。
- 自然言語/タグ対応・多様性(danbooruタグ効く、バリエーション豊富): »263/271「クオリティタグで絵柄激変、複数キャプション学習」、»272「danbooru言語使える」、»298「ネガティブプロンプト機能面白い」、»390「バリエーション豊富、小細工なしガチャ楽しめる」、»401「SD1.5模様プロンプトそのまま通る」、»408「彩度高ければZI判別」。
- サンプラー/スケジューラ最適化(理由: テンプレ罠多、euler+simple/simple/beta57最強): »249/295/297/325「euler+beta57/simpleで綺麗肌、テンプレ罠」、»270「LightningLoRA/Turboよし」。
- 構図/アニメ強みだが欠点多(指/手弱、エロ/画質微妙、日本語弱): »280「配置強い指弱、SDXLベースに良い」、»234「エロ低解像度ザラザラ」、»241「日本語プロンプト全然ダメ」、»257「qwen3 4Bエンコーダで日本語理解度低い」、»293「構図良いが画質悪/アーティファクト/エロ無理」、»314「baseで油絵テクスチャ」、»379「脱肛気味だが具ありマン描ける」、»385/394「日本語まあまあわかるが微妙」、»396「手腕崩れやすい」、»416「ガチャ感強い」。
- LoRA学習しやすさ(理由: 軽量で即実験可能、musubi-tuner/aitoolkit対応): »240「LoRAでMD記法?」、»253「小サイズで評価→本サイズFT」、»327/360/373/424「LoRA学習例多(乳首省略阻止、人体欠損改善)、学習率/解像度/epoch調整」、»378/380「musubi-tunerで学習可(変?)、4080Sで15h」。
- その他ツール対応・将来性: »266「forge neo即対応」、»294「CivitaiにGGUF」、»311「LLMサイズ変え希望」、»407「tiled diffusion?」、»432「SD WebUI普通に使える」、»434「イラスト系良さそう」。
SDXL(Z-Imageとの比較対象として頻出)
- 高性能だが重い/限界あり(理由: Z-Imageベースに大規模学習で超え期待、無印悪い): »239「無印でなんやこれ…」、»246「ベース同士比較でZ-Imageポテンシャル」、»254「左右/文字周回遅れでもシコシコ十分」、»259「Z-Image進化でSDXLでいいじゃん流れ」、»335「複数人/背景/構図限界、おシコ1girlなら十分」。
SD1.5(過去比較・プロンプト互換)
- クオリティタグ時代思い出す(理由: Z-ImageでSD1.5プロンプトそのまま効く): »263「SD1.5時代クオリティタグで絵柄変わる」、»401「SD1.5模様プロンプト→ZIで通る」、»408「サムネでSD1.5/ZI判別彩度」。
その他のマイナー言及
- SD3: »254「微妙過ぎた」。
- Lumina2: »259「性能低い→SDXLでいいじゃん」。
全体傾向: Z-Imageは「軽量ベースモデル」として熱く議論され、LoRA/高速化/エロチューン待ちの声多数。SDXLはベンチマーク的存在だが、Z-Imageの将来性に期待集中。エロ/日本語/指などの弱点を人力/LoRAで補う運用が主流。