抽出結果: 指定モデルに関する話題
ログ全体から、指定モデル(NovelAI (NAI), illustrious(イラストリアス, リアス,ill,IL), FLUX, Wan, Qwen-Image, anima, Z-Image(Z-Image Turbo,ZIT,ZIE))の言及をすべて抽出。NovelAI (NAI), FLUX, Qwen-Image, Z-Image 系列の直接的な言及はなし。以下にモデルごとにまとめ、特に選ばれている理由や利点・欠点が明記されているものを太字で強調。
anima (最多言及: 446,447,448,449,450?,451,452,453,454,455,460,461,475,476,481,482,492,499,502,508,509?,555,585,595,626,635,643,644,645,648)
- 446: 好みの絵柄重視の一般勢は乗り換えづらい。細かい指定が効くが「抜けない絵」になる。
- 447: 温泉シチュで乳首指定時、お湯が腰まで浸からずオッパイ沈めて乳首見える構図がLoRA無しで可能(感動)。SDXL系統より優位。
- 448: 好きなモデルで画像生成→anima用LoRA作成で絵柄違和感緩和。
- 449: pony時代から長く手に馴染む。詳細指示(車いすの原作再現など)がpromptだけで効く(SDXL系統では不明・出にくい)。
- 450: Preview1で作ったLoRAをYumeで使用(anima関連)。
- 451: 画風だけの問題ならanima使わない理由なし(i2i構図後リアスで画風適用も可能)。
- 452-453: 影色指定可能(英語力次第で青みがかった影色実現)。
- 454-455,467-472,474,476,480-482,508,509,521: anima用LoRA作成の話題多数。素材質が高いほど効果発揮(482: anima2でブレイブリーデフォルトLoRA成功、3Dグラフィック精度高く、タグポン出しで構図固定注意)。国民的アニメ画風LoRA練習(519)。kohya_ss GUI非対応?(554)。
- 460-461: 低CFG・低ステップ生成モデル出てるが満足クオリティに達しにくいイメージ。
- 475: slashing生成上手いか?
- 481: 1024解像度でも低く感じない(リアス比較で優位)。線・塗り・陰影質感硬め。
- 482: anima2 LoRA作成メモ: 素材20枚、タグ未修正で高精度だが構図固定注意。
- 492: 服・髪綺麗だが指へたくそ→具体的な指指示で綺麗に出す(6本指ご愛敬)。
- 499: プロンプト追従性高いため指示外補完控えめ。
- 502: eazywan民がanima動かずForge環境構築決意。
- 555: danbooru/偽タグ混ぜても自然言語理解しやすく通りやすい。プロンプト構築自動化進む(画像投げてタグ付け)。
- 585: animav2でアナルビーズ生成(破綻気味)。
- 595: 特定ブロック二度漬けで良化・Spectrumで高速化(他モデルでもSpectrum使用可)。
- 626: 理想の質感に近いLoRAできた。
- 635: Anima 2B - Qwen 3.5 4B Text Encoderで複雑・長いプロンプト理解度大幅向上。
- 643-645,648,649: 複数キャラ描き分け難しい(要素混ざる)。コツ: キャラ名/外見主語、個別行動記述、極端強調、リージョナルプロンプト、インペイント。HFに複数キャラprompt例あり。構図ガチャよりprompt自然。
illustrious (イラストリアス, リアス, ill, IL) (言及: 451,463,476,481)
- 451: i2iで構図後画風適用に使う(anima構図+リアス画風で1WF完結)。
- 463: 奥行き出せない・迫力出にくい。
- 476: anima LoRAでリアス絵柄再現挑戦推奨。
- 481: anima比較で線・塗り・陰影質感硬い(再現度90%目指す)。
Wan (言及: 459,484,485,502-507,515,524-528)
- 459: VRAM6GBでローカル画像生成→クラウドGPUでwan2.2動画生成。
- 484-485: wan2.2で–gpu-only無効(動画生成で処理止まる、VRAM32GB超えオフロードせず)。
- 502-507,515,524-528: eazywan(EasyWan, EasyWan22)環境話題。anima/SmoothMIXv2動かずComfyUI移行推奨。WF理解にSDXLシンプルtxt2img必要。VRAM節約効くが最新Comfy非対応。
Qwen-Image / Qwen系列 (言及: 555,556-557,635 → Qwen3.5中心、Qwen-Image直接なし)
- 555: qwen3.5でdanbooru/偽タグ混ぜやすいがanimaで自然言語理解優位。
- 556-557: Qwen3.5 thinkingクッソ長い(20倍、過剰思考・軽量モデル切推奨、設定独特)。
- 635: Anima 2B - Qwen 3.5 4B Text Encoderで複雑プロンプト理解向上。
まとめ洞察:
- anima が圧倒的に好評でメイン。詳細prompt追従性・構図精度・LoRA適性・自然言語理解が選定理由の核心(SDXL/リアス超え)。欠点: 絵柄乗り換え難、指破綻、複数キャラ混ざり。
- リアス: 画風適用専用、奥行き弱い。
- Wan: 動画生成特化(wan2.2)、VRAM制約。
- LoRA作成が全般クロストピックでanima/リアス中心。ハード/VRAM/ComfyUI環境話が絡む。
抽出された生成AIモデルに関する話題(除外モデル以外)
ログ全体から、除外指定モデル(NovelAI, illustrious/リアス/ill/IL, FLUX, Wan, Qwen-Image, anima, Z-Image系)を除いた「モデル」に関する言及を抽出。主にモデル名が明示的に登場し、生成性能・特徴・理由・比較などが語られたものをピックアップ。特に選ばれている(または推奨/評価されている)理由が明記されているものは太字で強調。
1. SDXL (Stable Diffusion XL系モデル)
- 449: sdxl系統だと車いすの詳細構図(原作の車いすに乗ってアームレストに手を拘束など)がpromptだけでまともに出にくい。anima(除外)と比較して構図生成の精度が劣るため、試す気にならない。
- 503: ComfyUI環境でSDXLに戻る選択肢として言及(最新モデル諦めて)。
- 526: WF理解の最初にSDXLのシンプルtxt2imgとHires.fixを挙げる(学習の入門として適している)。
- 568: SDXL系モデルでまんぐりポーズ(piledriverなど)が全然上手く出ず、四つんばいポーズになりやすい。調整しても打率低い。
2. Yume
- 450: Preview1でLoRAを作ってYumeで使用(»448のanima LoRA作成法を真似)。
3. SmoothMIXv2
- 502: eazywan民がSmoothMIXv2も動かないため、ForgeneoPortable環境構築を決意。
4. Preview1
- 450: Preview1でLoRAを作成(Yumeで使う前提)。
5. SD1.5
- 575: 初期のSD1.5をRadeonグラボで動かした経験(情報少なくエラー多発したが、最初の画像生成に成功しガッツポーズ。グラボ買い替えずに実用化した)。
6. Grok
- 541/542: 「grok、お前がWF作れ」(ワークフロー作成に期待)。
- 551: grokがa1111用promptを出してくれる。anima(除外)と違い事細かな説明が必要少ない。
- 610-612: LTX2.3との動画比較で高評価。720p10秒爆速(2分生成)、セリフ指示通り、フレーム延長可能(画質落ちるが)。ただ映像と声のトーン合わず、Grok製画像のI2Vで微妙に合わない。sora2/grokに迫る可能性。
- 627: ltx2(LTX)とsora2前のwebサービス並みの日本語品質。
7. Qwen3.5 (おそらくテキストエンコーダー/LLMモデル、Qwen3.5 4B含む)
- 555: danbooruタグと偽danbooruタグを混ぜても自然言語として理解しやすく、プロンプト構築自動化が進む(animaで通りやすい)。
- 556/557: thinkingがクッソ長い(Qwen3の20倍)。過剰思考で軽量モデルでは効果薄く、切るのが正解。設定独特。
- 635: Anima 2B - Qwen 3.5 4B Text Encoderで複雑/長いプロンプト理解度大幅向上(と記述)。
8. LTX / LTX2.3 (動画生成モデル、LTX-2.3 / ltx2.3)
- 479: LTXのためにComfyUI導入(プロンプト検閲でバタ臭い出力が出た)。
- 609-611/614/617-637: 動画生成で高評価多数。
- 画質/解像度/速度: 1080p20秒(最大4k)、生成時間優秀。アメリカン画質だがV1.1で改善。ローカル版sora2/grokの可能性。
- 音声/日本語: イメージ通りの声質、空気感乗る自然さ。漢字苦手だがカタコト少なく、sora2/grokに迫る。字幕出やすい欠点(サンプラー変更/Negativeで"subtitles"追加で抑制)。
- 実写強いがエロ/アニメ弱い: 素モデルでエロ動作無視、LoRA推奨(特殊性癖LoRA少ない)。パコパコ動画ならwan(除外)より手っ取り早いが、全体的にエロ対応イマイチ。
- 612/627-634: ガチれば自然日本語可能、音声/リップシンク強い。二次エロ弱いが可能性感じる。
9. dasiwa (dasiwa v10)
- 638/640: v10がリリース(smooth mixに続いて登場。アーリーアクセス3k高価、15days待機)。
その他のマイナー/間接言及
- 国民的画風LoRA (509/516/519): シンプルな絵5枚(モノクロ/家族画像)で高速学習成功。画風単純で再現しやすく練習向き(GPTでキャプション)。
- v4以前のレガシーモデル (457): データセット更新でキャラ参照精度低下。元に戻してポーション併用希望(コンテキストからanima関連だが明示せず)。
これらはログの文脈で「モデル」として機能/比較が議論されたもの。LoRA作成法やツール(ComfyUI, kohya_ss, A1111系, EasyWanなど)はモデル本体でないため除外。SDXL/SD1.5のような基盤モデルは性能限界が理由で言及多め。LTX2.3/Grokは動画特化で積極評価。