以下は、提供された5chのログ(レス番号4から246まで)から、指定された生成AIの「モデル」に関する話題をすべて抽出したものです。抽出の基準は以下の通りです:
- 対象モデル:NovelAI v4もしくはv3 (NAI), Pony, illustrious 0.1,1.0,1.1,2,3,3.5vpred (イラストリアス, リアス,ill), Noobai, FLUX, HiDream, Wan2.1 (wan), FramePack。
- モデル名が明示的に言及されている箇所を抽出。
- 特にそのモデルが選ばれている理由(例: 性能、安定性、生成速度、特定の用途での優位性など)が述べられている場合、それを強調して抽出。
- 抽出はログのレス番号順に整理し、重複や文脈を考慮して簡潔にまとめ。関連する周辺の話題も最小限含めて文脈を明確に。
- 対象外のモデル(例: HakushiMix, Songmixなど)は抽出対象外。
NovelAI v4もしくはv3 (NAI)
- レス53-54: 「一番アニメキャラを網羅したモデルってどれだろう? LORA無しで」に対し、「そら結局NAIちゃんやないか」と回答。理由: アニメキャラの網羅性が高いため(LORAなしで多様なキャラクターを生成可能)。
- レス123: 「数週間以上の長期の出張でもなけりゃスマホで済む範囲でいいやになるわ そういう意味だとNAIちゃんクソ強いよな」。理由: スマホ対応で出張時などのモバイル環境で強い(ローカルPC不要)。
Pony
illustrious 0.1,1.0,1.1,2,3,3.5vpred (イラストリアス, リアス,ill)
- レス64-66: 「リアス系列で日本人出すのにええリアルモデルある?」に対し、「日本人出すならXLでもfluxでもなく、wanや」と回答。リアス系列の文脈で登場するが、リアス自体は選ばれず、wanが推奨。理由: リアス系列では日本人生成が難しいため、wanが代替として優位(試行錯誤不要で良い結果)。
Noobai
FLUX, HiDream
- レス64-66: 「リアス系列で日本人出すのにええリアルモデルある?」に対し、「日本人出すならXLでもfluxでもなく、wanや」と回答。FLUXが登場するが、選ばれず、wanが推奨。理由: FLUXでは日本人生成が難しく、wanの方が優位(試行錯誤不要で良い結果)。
Wan2.1 (wan)
- レス30: 「ワイもメモリ32GB勢なんなんら加えてVRAM8GB勢 若干SSDにはみ出してるが生成は出来てるで(wan2.1、2.2ともに)」。理由: 低スペック環境(VRAM8GB, RAM32GB)でも生成可能。
- レス31: 「ワイも3070無印の8GBにメモリ32GBや とりあえず640x480の49フレーム(2秒)あたりから始めてみるといいで Lightx2v使って4+4stepsなら5分ぐらいでできる」。理由: 低スペックで動画生成が速く(5分程度)、初心者向けに低解像度からスタート可能。
- レス38: 「これは触って見るしかねえ。 (モデルダウンロード1つ1時間)今日は勘弁しといてやる…」。wanのダウンロード時間が長いが、触ってみる価値あり(文脈から性能の高さが示唆)。
- レス45: 「ワイもzuntanニキので同じエラーになったけど ComfyUI-WanVideoWrapper を消してnightlyで入れなおして WanVideo Lora Select ノードのmerge_lorasをfalseにしたら通ったわ」。理由: エラー回避の設定で安定生成可能(GGUFや量子化との相性)。
- レス48: 「merge_lorasはGGUFとscaled fp8では常に有効なんで モデルの量子化とかLoaderのquantizationとかに食い違いがあるとかやろか?」。理由: 量子化(GGUF, scaled fp8)との相性が良く、設定次第で安定。
- レス64-66: 「リアス系列で日本人出すのにええリアルモデルある?」に対し、「日本人出すならXLでもfluxでもなく、wanや 今まで泣きながら試行錯誤してたのがアホらしくなるで 静止画で出すもよし、動画もそんなに時間かかんないし」。理由: 日本人生成が容易で試行錯誤不要。静止画・動画両対応で生成時間が短い。
- レス67: 「VRAM10GB RAM32GB構成&GGUF Q4でWanVideoWrapperでI2V回してみたら2時間ぐらいかかって笑っちゃうんすよね」。理由: 低スペックで動画生成可能だが、時間かかる(設定次第で改善の余地)。
- レス72: 「WanVideoWrapperでlightx2v使うフローあんまり綺麗に出力できなくて諦め comfyui公式のフローベースで遊んでたほうがいい感じになったわ 何人かのニキが書いてたけどwan2.1で学習したLoRAも強度2ぐらいまで上げたら効くやね 強度3で複数重ねると流石に壊れ始めるが」。理由: LoRAの適用が良く効き、強度調整で綺麗な出力可能(comfyui公式フローとの相性良い)。
- レス73: 「XLしか使ってなかったけどwanそんなにええんか」。wanの良さが話題に(文脈から動画・リアル生成の優位性)。
- レス74: 「Comfyの最新アプデに5Bの使用メモリめっちゃ減らしたでってのがあったので3070で試してみた ↓14BのQ4_K_S.gguf版使用で640x480の49フレーム、Lightx2v併用でcfg1の4+4steps、所要時間3分ほど ↓5B使用で1280x704の49フレーム、Lightx2vは14B用で使用不可なのでcfg5の30steps、所要時間6分ほど うちの環境では14Bだと横1000超えたあたりでOut of Memoryになるので、確かに使用vramはかなり減ってるっぽい ただメインメモリ32GBだとvaeのデコードでメモリ足りなくなるので、VAE Decode(Tiled)を使用しないとダメ キレイに出すなら5Bのがいいか?」。理由: メモリ使用量が減り、低スペック(3070)で高解像度動画生成可能。5B版が綺麗で安定(Out of Memory回避)。
- レス75: 「もう一つ忘れてた 5B用のvaeはwan2.2_vae.safetensorsってバカデカいファイルがあるので使うなら落とすべし」。理由: 専用VAEで生成品質向上。
- レス76: 「生成している場合やないな皆避難しとるかあ」文脈でwan生成中(避難時の話題だが、継続使用の示唆)。
- レス103: 「WAN画像生成も良さそうやなと思ってやってみたら1枚7分かかって笑った」。理由: 画像生成可能だが時間かかる(文脈から試用価値あり)。
- レス104: 「Wan2.2のサンプルワークフローのギター弾いてるおっさんは生成できた 無印4070で13分かかった」。理由: 4070で生成可能(時間かかるが動作)。
- レス113: 「アカンwan2.2の5B無理すぎ!ってなったから試しに14B+Lightx2vの環境作ったが、速度差が変わらん程度まで解像度落としてもこっちのが遥かに安定するやんけ… 問題はフレーム数が一定以上やとoutofmemoryエラー吐くんやがこれはVRAM12GBじゃ不足してるって事で諦めるしかないんかな」。理由: 14B版が安定性高い(5Bより優位)。VRAM12GBでフレーム数制限あり。
- レス149: 「187秒かかったがwan2.2でlora適用もできたやで!みんなサンガツ!」。理由: LoRA適用可能で生成成功(時間かかるが動作)。
- レス156: 「Wan2.2のt2vで空飛ぶJK 環境:RTX3080(VRAM12GB)、メモリ128GB(DDR4:32GBx4) 時間:high 02:31/low 02:30」。理由: 高スペックで動画生成が速く、良い結果(空飛ぶJKの例)。
- レス208: 「WAN2.2 エンドフレーム入れるとループはいい感じになるが動きが減ってしまうな」。理由: ループ生成が良いが動きが制限される(設定次第)。
- レス214: 「Wan2.2だけどt2v(t2i)とi2vは安定して生成出来るようになったんやが ti2vだけKサンプラーのところ100%になってもVAEデコードでずっと詰まって 動画が生成されんのやが何がいけんのやろか・・・?」。理由: t2v/i2vが安定生成可能(ti2vはエラーあり)。
- レス215: 「つなみにげて!はええけど数十cmの津波にビビッて暑い中避難して熱中症で倒れたら笑い話やなあ とか最低なこと考えながらwan触ってた一日やったわ…」。wan使用中(避難時の話題だが、継続使用の示唆)。
- レス218: 「14Bの方はWan2.1用のVAEやけど5Bの方はWan2.2用のVAEが要るんじゃなかったっけ?」。理由: バージョン別VAEで安定生成。
- レス222-223: 「wan2.2って20ステップ以外対応してないんやろうか? 本来各モデル10ステップ、10ステップになると思うんやけど、ほかのステップ数やと半分ずつにならんのよね ごめん自己解決したわ start_at_stepとend_at_stepをいじれば良かったんか」。理由: ステップ数調整で柔軟対応。
- レス225: 「それはメモリ不足でエラー出てるんで、VAE Decode (Tiled)ってノードに差し替えるんや」。理由: メモリ不足回避で安定。
- レス230: 「VRAM12GBとメモリ128GBなんやがタイルサイズとかオーバーラップとかの値は何が正解なんやろか・・・」。理由: 高スペックで動作可能(設定次第)。
- レス237: 「デフォ値で生成完了したで 情報サンガツや! しかしt2vとi2vよりなんかいまいちやな・・・w」。理由: t2v/i2vが比較的良いがti2vはいまいち。
- レス241: 「ようやっとwan2.2デビューや! すごいなこれ」。理由: デビューで高評価(動画生成の凄さ)。
- レス243: 「2.2は破綻も少なくホントよく動くからガチャが捗るで」。理由: 破綻少なく安定動作でガチャ(生成試行)しやすい。
- レス246: 「3060とDDR3のRAM32GBでほんまにwan2.2動きおった…ワイも動画に手を出してええんやな」。理由: 低スペック(3060, RAM32GB)で動作可能、動画生成に適す。
FramePack
抽出の結果、Wan2.1 (wan)が最も多く話題に上り、特に低スペック環境での動画生成の安定性や日本人生成の容易さが選ばれる理由として強調されています。他のモデルは言及が少なく、NAIはアニメキャラ網羅性で、FLUX/HiDream/リアスはwanの比較対象として登場します。抽出対象外のモデル(例: HakushiMix)は無視しました。追加のログがあれば、さらに抽出可能です。
—以下は、提供された5chログから、生成AIの「モデル」に関する話題を抽出したものです。抽出の基準は以下の通りです:
- 生成AIのモデル(主にStable Diffusion関連の基盤モデルや派生モデル)に焦点を当て、除外モデル一覧(NovelAI v4/v3 (NAI), Pony, illustrious 0.1/1.0/1.1/2/3/3.5vpred (イラストリアス, リアス, ill), Noobai, FLUX, HiDream, Wan2.1 (wan), FramePack)を厳密に除外。
- 除外モデルが言及されていても、その部分を避け、他のモデルに関する話題のみ抽出。
- 特に、そのモデルが選ばれている理由(例: 品質の改善点、安定性、生成速度、特定の用途での優位性など)が明示されている場合、それを強調して抽出。
- ログの投稿番号を参考に、関連する話題をグループ化してまとめ。重複や非モデル関連の雑談は省略。
- 抽出はログの流れを尊重し、時系列的に整理。
抽出されたモデル関連話題
1. HakushiMix v1.41 (hakushi1.41)
- 関連投稿: 49, 50, 51
- 内容と理由:
- v1.41は、v1.4の欠点(モノクロやラフっぽい絵が意図せず出てしまう問題)を改善したバージョン。v1.4ではmonochromeをネガティブプロンプトに入れても効果がない場合があったが、これを解消。ただし、v1.4より指の描写が弱い可能性があるため、指のクオリティを重視する人はv1.4のままで良い。
- 理由: モノクロ/ラフ絵の制御性を高めるための改善版として選ばれている。メカ(機械)描写も可能で、v1.41用に作ったメカLoRAが背景を良く出力する。アーマードコア風の四脚メカをケンタウロスに融合させた生成例で、メカの汎用性を示唆。
- 抽出ポイント: 特定の欠点を修正したアップデート版として評価されており、メカ描写の柔軟性が理由で使用されている。
2. Wan2.2 (WAN2.2, 含む5B/14B版, Lightx2v併用)
- 関連投稿: 30 (2.2部分のみ), 31, 38, 45, 48, 66 (Wan2.2関連のみ), 67, 72, 74, 75, 76, 104, 113, 149, 156, 157, 159, 187, 198, 208, 214, 220, 222, 223, 225, 230, 237, 239, 241, 243, 245, 246
- 内容と理由:
- Wan2.2は動画生成(t2v, i2v, ti2vなど)で安定し、破綻が少なく、動きが良い。例: 空飛ぶJKのt2v生成で、RTX3080 (VRAM12GB, RAM128GB) でhigh/low各2:30分程度。5B版は高解像度(1280x704, 49フレーム)で6分、14B版 (Q4_K_S.gguf) は640x480で3分(Lightx2v併用でメモリ効率向上)。5B版専用VAE (wan2.2_vae.safetensors) が必要。
- 理由: 安定性が高く、動画生成が速く破綻しにくいため選ばれている。特に、14B + Lightx2vは解像度を落としても安定(VRAM12GBでフレーム数制限あり)。LoRA適用可能で、強度2まで効き、学習もdiffusion-pipeで5B版対応(14Bはモデル2種のため難しい)。日本人描写や動画生成で優位(例: 静止画/動画の試行錯誤が不要になる)。エンドフレーム設定でループが良くなるが動きが減る。ステップ数は20以外も調整可能 (start_at_step/end_at_step)。
- 環境例: VRAM8-12GB, RAM32-128GBで動作。メモリ不足時はVAE Decode (Tiled) に置き換え。ComfyUI-WanVideoWrapper使用でGGUF Q4やmerge_loras=falseでエラー回避。全体として、動画生成の未来感(ガチの動画年)と汎用性が理由で人気。
- 抽出ポイント: 動画生成の安定性・速度・破綻の少なさが主な選定理由。ハードウェア制約下での最適化(例: Lightx2v併用)が強調されている。
3. SONGMIXシリーズ (Songmix3.3, lillyMix_v2.1, Msgkシリーズ)
- 関連投稿: 244
- 内容と理由:
- SONGMIXシリーズはアニメ風生成で多用され、Songmix3.3とlillyMix_v2.1が特に気に入られている。モデルリストの多くを占めるほど常用。
- Msgkシリーズはサンプリング/スケジューラー設定が限定的で、LCMサンプリング使用時にガビガビな絵になる問題あり(他の設定を試しても改善せず)。
- 理由: Songmix3.3/lillyMix_v2.1は出力の質が高く、モデルリストを埋めるほど信頼性があるため選ばれている。一方、Msgkはサンプリングの相性問題で使いにくい。
- 抽出ポイント: シリーズ全体の信頼性が高いが、Msgkの限定的設定がネック。アニメキャラ生成の網羅性で議論された文脈で登場。
4. その他のモデル関連話題(汎用/将来性)
- 関連投稿: 53, 55, 73, 74, 113, 224, 235
- 内容と理由:
- アニメキャラをLORA無しで一番網羅したモデルは? → キャラクター追加学習モデルが少ないため、ベースモデルが同じなら似たり寄ったり。
- XLモデルしか使っていなかったが、Wan2.2のような新モデルが良いか? → ComfyUIアプデでメモリ使用が減り、14B/5B版のテストで高解像度動画が可能に。
- SD全体の将来: SD3以降でR18全面禁止の可能性(Xデー)。エロモデル粛清の懸念で、Civitaiから今のうちにダウンロード推奨。
- 理由: キャラクター網羅性では追加学習の少なさが理由で差が出にくい。メモリ効率向上(Comfyアプデ)で新モデルが選ばれ、規制リスクで既存モデルの保存が推奨。
- 抽出ポイント: モデル選択の背景として、キャラクター網羅性や規制リスクが議論されている。
追加の考察
- ログ全体でWan2.2が最も活発に議論されており、動画生成の革新性(安定・速度)が選定の主な理由。HakushiMix v1.41は具体的な改善点が理由で抽出。
- 除外モデル(例: Wan2.1, illustrious, NAI)は関連投稿から厳密に除去(例: 66のWan2.1部分は抽出せず、Wan2.2のみ)。
- 抽出量を効率的にするため、冗長な部分をまとめ。もし特定のモデルや詳細についてさらに深掘りが必要なら、追加の質問をお願いします(例: 特定の投稿番号の詳細)。