NovelAI (NAI)
- 466: novelaiの機能にフラストレーションが溜まったからillustriousデビューしようかな。理由: NAIの機能に不満(フラストレーション)で移行検討。版権キャラの絵柄再現が物足りないか気になる。
- 470: 自作LoRAに手を出さないとローカル単体モデルでNAIちゃんに版権・画風追いつくの無理。理由: NAIの版権・画風再現性能が高いため、ローカルモデルが追いつけない。
- 492: グラボより安いやろってnai使ってたけど課金額1年で4万超え。理由: 初期はグラボより安いと思っていたが、実際の課金が高額で継続しにくい。
- 516: NAIちゃんはV2の頃がお手軽で楽しかった。理由: V2がお手軽で使いやすかった(過去の好印象)。
- 517: NAIちゃんのV2ってなんか無かったことにされた感じ。NAI Diffusion Anime V3って書いてあった。
- 519: 初期の魔神とponyよりは描けてたんよな。V3は今使うと解像度とカットオフ時期が古すぎてキツそう。
Pony
- 519: 初期の魔神とponyよりは描けてた(NAI V3比)。理由: NAI初期モデルより描画性能が劣る印象(過去の比較)。
illustrious (イラストリアス, リアス, ill, IL)
- 466: novelaiの機能にフラストレーションが溜まったからillustriousデビューしようかな。版権キャラの絵柄再現って物足りないとかあるんかな? 理由: NAIの機能不満で移行検討。版権再現性を懸念。
- 498: V3=リアス、V4.5はV3以下(ベースプロンプトを作り込まないとつらい)、V4.5キャラ参照でV3以上=ローカルLoRA。理由: V3はリアス相当で高性能だが、V4.5より下。LoRA併用で上回る。
- 501: リアス組み込んでFaceDetailerもやってみたけど一貫性保てなくてオクラ。リアスかけた後にWANやれば行けると思ったが儚い夢。
- 504: リアスで書き換えるのに興味があったがアカン。WanVideoは動きにも適応。
- 514: V4.5はV3より上なイメージ?極めたLoRAが最強?
- 515: V3は完全にリアスやから使う価値ない。4.5は高性能だが絵柄制御難しい。理由: V3はリアス相当で価値なし。V4.5は絵柄制御難。
- 521: V4.5は絵柄ガッチガチで混ざらないから使いづらい?プロンプト作り込めばV3より上だが素だと下回る。理由: V4.5は制御しづらく素の状態でV3(リアス)以下。
Noobai
FLUX
- 542: Qwen-Image-Edit-Rapid-AIOでi to i試すが落ちる。fluxも良さげやろうけどクソデカらしい。理由: クソデカ(大容量)で3060 12GBでは厳しいと懸念。
Wan
- 495: メモリ128にしたからwanでbaseのfp16試してみたけどマジで顔が変わらない。Highがsmoothmixでlowがfp16だとかなり出来良い。理由: fp16 baseで顔の一貫性が高く、メモリ余裕で試せる。smoothmixとの組み合わせで高品質。
- 496: wan2.1, framePack(叡智), wan2.2と怒濤の動画技術。zuntanニキの2.1が無かったらwan2.2で自作WF作れんかった。VRAM12GB+MEM96GBでも綺麗な動画作れる。
- 501: リアスかけた後にWANやれば行けるやろと思ったが儚い夢。WANで顔上書きして諦め。
- 504: WanVideoは動きにも適応して何かやってる。
- 579: 3060 12gbの128gbやけどwan2.2やQIEのbf16がSSDスワップなく動く。生成時間許容範囲。
- 581: Wan 2.2ならfp16が相当。EasyWan22でfp16使えるか不明だがComfyUI推奨。
- 601: Wan 2.2 fp16相当。他のbf16はQwen-Image-Edit。
- 602: smooth mixで着衣乳揉み難しい(Wan関連のsmoothmix言及)。
Qwen
- 542: Qwen-Image-Edit-Rapid-AIOで元絵変えずにi to iできる?ぶっかけたり脱がせるなら他のmodelのがエエんやろか。3回目で落ちる(3060 12GB)。理由: i to i(img2img)で脱がせ/修正向きだが、VRAM不足で落ちる。
- 572: 3060/12GBに32GBでQwen-image-edit2511つこうてる。qwen-image-edit-2511-Q3_K_L.gguf(約10GB)。
- 576: QIEのBF16がモデルサイズ40GB、RAM100GB近くいくから最低128GB。RAMゲーでもある。
- 581: bf16はQwen-Image-Editのこと。
- 601: bf16はQwen-Image-Edit。
- 613: QIE2511の8STEPLightning欲しい。高速化なし20Stepきつい、4Step精度落ち。今は4Step高速化LoRAで8ステップ。
- 624: Qwenで背景書き直させようとしたらキャラまで書き換えられて使えない。
- 626: 2511でも十分だがconsistence_edit LoRA使うとキャラ維持良い。背景詳細に描いてほしい。
- 631: キャラマスク→マスク反転してQwenにインペイントマン。でもQwen重いからあまり使ってない。
抽出された生成AIモデル関連話題(除外リスト外のみ)
ログ全体から、生成AI(主に画像/動画生成)の「モデル」に関する言及を抽出。除外リスト(NovelAI/NAI, Pony, illustrious/リアス/ill/IL, Noobai, FLUX, Wan, Qwen)に該当しないものに限定。ツール/サンプラー/WF(例: ComfyUI, Tiled, LCM, ESRGAN, SageAttentionなど)はモデルとして扱わず除外。LLM/TTSモデルも画像生成文脈での言及に絞り、重複をまとめつつ選ばれている理由を明記。
SD1.5 (Stable Diffusion 1.5)
- 言及箇所: 444, 446, 453, 480, 499, 519 (間接)。
- 内容と理由:
- 444: 192GB VRAM + 5090で目一杯回す(高スペック環境でフル活用)。
- 446: ジェスチャー制御で使用、手の修正に活用(過去のA1111環境で手修正に使用、ComfyUIでも類似期待)。
- 453: SD1.5で192GB/5090の組み合わせを「すごい文字列」と称賛(ハイエンドVRAM活用の象徴)。
- 480: 風景画でアプスケ2回使用(実用的風景生成に適す)。
- 499: 大きい物を描けない短所を逆手に細かい描写を多段生成(知的アプローチでポテンシャル引き出し)。
- 選定理由: 高VRAM環境での安定動作、細部制御のしやすさ、風景/手ポーズなどの特定用途でポテンシャル高く評価。1.5の「短所」を逆用するテクニックが知的と好評。
SDXL (Stable Diffusion XL)
- 言及箇所: 447, 476, 477, 509。
- 内容と理由:
- 447: アプスケマニアとして最低1次→2次→3次出力必須(モデルのポテンシャル引き出しに最適)。
- 476: 風景画で多段アプスケ主流、CIV人気WFでDetailerと併用(実用的高品質風景生成)。
- 477: 多段アプスケ(T2I/upscale/noise inversion)の実践例、3060/64GBで2時間、5090で30分(時間対効果で普段使い3段まで推奨、高denoisingでランダム性重視の博打打ちスタイル)。
- 509: 独特ハンドサインで最小単位が手のひら級(ポーズ制御の限界示唆)。
- 選定理由: 多段アプスケ/Detailerとの相性抜群でポテンシャル高く、風景/高解像度生成で主流。時間効率とランダム性を活かした実践派に選ばれやすい。
Gemma系 (Rouwei-Gemma, T5Gemma, Rouwei 0.8)
- 言及箇所: 464, 472, 630。
- 内容と理由:
- 464: load_llm_model/llm_encodingで使用、checkpointはRouwei-Gemma(Rouwei 0.8推奨)、text_gでgesture/smile/expression制御(構図柔軟化、greeting gesture再現)。
- 472: adapter/T5Gemmaモデルダウンロード前提のWF共有(人体実験用)。
- 630: T5Gemma-TTSで音声生成、誤読多め(ふりがな必要、しゃべり再現に使用)。
- 選定理由: テキストエンコーディング/gesture制御/TTSで柔軟構図・表情生成に特化(happilyで全体柔軟化)。ComfyUI WFでプラセボ超えの効果、Rouwei 0.8が合う点が実践的。
Grok
- 言及箇所: 491, 502, 551, 552, 593, 597。
- 内容と理由:
- 491: クラウドでエロ動画不可(ローカル必須の一年の教訓)。
- 502: 日本語向上もエロ徹底弾かれ残念。
- 551: 動画生成失敗時キモくなる、プレ垢買っても規制祭りで使用減。
- 593: プロンプト過剰表現調教に活用(ベース+Loraで顔一貫性/動き維持)。
- 597: 動画生成で「好み選ばせ」機能出現。
- 選定理由: 動画生成のプロンプト調教/比較機能で便利だが、エロ規制厳しくローカル代替推奨。日本語対応向上も失敗時の奇抜出力がネック。
Firefly (Adobe Firefly)
- 言及箇所: 518。
- 内容と理由:
- 518: ポーズ指定(手上向き/指くっつけ)で一撃生成成功も、ユーザーガイドライン違反で生成拒否。
- 選定理由: ポーズ制御精度高く大手クオリティだが、エロ/特定ポーズでガイドライン厳格(生成すら不可)。
その他のマイナーモデル/言及
- LTX-2 (586): 1月オープンソース公開予定。ローカル動画進展期待、スペック要求低め(エロ有無不明)。
- 選定理由: ローカル動画の「デカい進展」候補、低スペ対応で注目。
- ZIT (479): エロモデル公開待ち(ChatGPTアダルトOK比較)。
- SAM3 (Segment Anything Model 3) (520): 自動マスク処理で検出精度高く調整し甲斐あり。
- 選定理由: 高精度セグメンテーションで環境構築推奨。
抽出まとめ: 主にSD1.5/SDXLが基幹モデルとして高スペ/テク多用で頻出(VRAM活用/アプスケ理由)。Gemma系はWF補助、Grok/Fireflyはクラウド動画/ポーズで言及多めだが規制ネック。LTX-2など未来期待モデルも散見。全体的にローカル高スペ環境(VRAM12GB+/RAM128GB)前提の話題が中心で、モデル選定は「VRAM効率」「ポテンシャル引き出し」「エロ耐性」で決まる傾向。