以下は、提供された5chログ(241〜441)から、指定された生成AIの「モデル」に関する話題をすべて抽出したものです。抽出の基準は以下の通りです:
- 指定モデル:NovelAI v4もしくはv3 (NAI), Pony, illustrious 0.1,1.0,1.1,2,3,3.5vpred (イラストリアス, リアス,ill), Noobai, FLUX, HiDream, Wan2.1 (wan), FramePack。
- ログ内でこれらのモデル名(または略称)が言及されている箇所を抽出。
- 特に、そのモデルが選ばれている理由(例: 性能、使いやすさ、特定の用途など)が明記されている場合、それを強調して抽出。
- ログの大部分がWan2.2(指定外の派生モデル)に関する議論ですが、指定モデルに限定して抽出。Pony, illustrious, HiDream, FramePackはログ内で一切言及されていないため、抽出対象外。
- 抽出はログのレス番号順にまとめ、関連する文脈を簡潔に記述。重複や文脈の薄いものは統合して効率化。
抽出結果
FLUX
- 242: 「fluxとか動画の時だけ使ってるけど どんだけやってもwebuiのが作りやすいねんな」
- 選ばれている理由: 動画生成の時だけ使用。WebUIの方が作りやすいため、FLUXは補助的に選ばれている(動画特化の利点があるが、全体の使いやすさでは劣るニュアンス)。
Wan2.1 (wan)
- 256: 「EasyWan22で今日Kijaiニキが対応したプロンプト拡張に対応したんやがかなりええ感触でおすすめやで … Wan2.1の頃からネガティブも中国語のほうがええ感触やったんやが」
- 選ばれている理由: Wan2.1の頃からネガティブプロンプトで中国語が効果的だったため、プロンプト拡張の文脈で推奨。EasyWan22(Wan派生)と組み合わせると良い感触(プロンプトの精度向上)。
- 269: 「AI動画スレの方でWan2.2 14BはWan2.1と同じ16fpsが正しいってなっているみたいだけどマジ?」
- 選ばれている理由: Wan2.1と比較してWan2.2のFPS(フレームレート)が同じ16fpsである点が議論。Wan2.1を基準に正しい設定を検証するための言及。
- 275: 「Wan2.2のhuggingとかgithubでも … このモデルは、720P解像度で24fpsのテキストから動画への変換と画像から動画への変換の両方をサポートし… Note: The TI2V-5B model supports 720P video generation at 24 FPS. って感じで書かれてて14Bモデルで24fpsに対応とか書いてないし」
- 選ばれている理由: Wan2.1との比較でWan2.2のFPS設定を議論。Wan2.1を基準に、Wan2.2の14Bモデルが16fps(Wan2.1と同じ)である点を指摘(公式ドキュメントに基づく正確性重視)。
- 395: 「Animon.aiの基盤技術は、Alibaba CloudのWan 2.1をカスタマイズしたモデルと、同社独自の「Ruyi」モデルを組み合わせたものだそうだから、Wan 2.2もカスタマイズすれば、アニメっぽくできるかもしれんね」
- 選ばれている理由: Animon.aiの基盤としてWan2.1がカスタマイズされているため、アニメ調動画生成に適している。Wan2.2への派生可能性を指摘(アニメ表現の自然さ)。
- 397: 「wan2?ぐらいで難しくて断念してたけど流石にこれは取り組むわ 動画aiは日進月歩やな」 / 「Wan2.1の時はプロンプトだけでここまで精細な描写は出来なかった」
- 選ばれている理由: Wan2.1ではプロンプトだけでの精細描写が難しかったため、Wan2.2との比較で進化を認識。動画AIの進歩を理由に取り組む価値あり(描写の精度向上)。
- 407: 「wan2.1すら触ってきてない人間やからとりあえずeasywanvideoから触ろうかなと思ってたんやけど… 2.2のi2vは…」
- 選ばれている理由: Wan2.1に触れていない初心者でもEasyWan経由で触りやすい。I2V(Image to Video)機能の文脈で言及(初心者向けのアクセシビリティ)。
- 420: 「wan2.1のときもやったが量子化はQ3-K-Mだとプロンプト理解力がガタ落ちするわ せめてQ4-K-M動かしたほうがよさそうやね」
- 選ばれている理由: Wan2.1での量子化(GGUFなど)経験から、Q3-K-Mではプロンプト理解力が低下するためQ4-K-Mを推奨(プロンプト精度の維持)。
Noobai
- 407: 「noobで作ったやつを動かしたんだけど逆レでマシな結果なのはさっきのだけだわすまんな」
- 選ばれている理由: Noobai(noobの略称)で作成した画像をWan2.2で動かす文脈。逆レイプ風動画の生成に使用(特定のエロ表現のベース画像作成に適している)。
NovelAI v4もしくはv3 (NAI)
- 433: 「naiがちゃんとした動画モデル出したらお祭りになるやろなぁ」
- 選ばれている理由: NAI(NovelAIの略)がちゃんとした動画モデルを出せばお祭りになるという期待。現在の動画生成トレンド(Wanなど)との比較で、NAIの動画対応が求められている(潜在的な人気と動画機能の不足を理由に)。
全体のまとめと考察
- 登場頻度: Wan2.1が最も多く登場(主にWan2.2との比較で基準モデルとして)。FLUXは1回、Noobaiは1回、NAIは1回。その他の指定モデル(Pony, illustrious, HiDream, FramePack)は一切言及なし。
- 選ばれている理由の傾向:
- Wan2.1はFPS設定、プロンプト精度、カスタマイズ性、初心者向けの使いやすさが理由で選ばれている。主にWan2.2の進化を測る基準として機能。
- FLUXは動画特化だが、全体の使いやすさでWebUIに劣るため補助的に。
- Noobaiはエロ表現のベース画像作成に特化。
- NAIは動画機能の期待値が高く、実現すれば大きなインパクトがある。
- 注意点: ログ全体がWan2.2中心のため、指定モデルは周辺的な言及が多い。抽出に際し、Wan2.2自体の詳細は指定外として除外(例: 多くのWan2.2の性能議論は含めず)。
- 提案: もし抽出範囲を広げたい場合(例: Wan2.2を含む全Wan派生)、またはログの追加があれば、さらなる抽出をお手伝いします。不明点があれば教えてください!
—以下は、提供されたなんJ(5ch)のログから、生成AIの「モデル」に関する話題を抽出したものです。抽出の基準は以下の通りです:
- 対象: 生成AIのモデル(主に動画生成や画像生成関連)に関する言及。特に、そのモデルが選ばれている理由(性能、使いやすさ、特定の機能など)が明記されている場合に抽出・強調。
- 除外: 指定された除外モデル一覧(NovelAI v4/v3 (NAI), Pony, illustrious 0.1/1.0/1.1/2/3/3.5vpred (イラストリアス, リアス,ill), Noobai, FLUX, HiDream, Wan2.1 (wan), FramePack)に該当するものは除外。例: FLUX (242)、Noobai (407, “noobで作った”はNoobaiの可能性が高いため除外)、Wan2.1 (複数箇所)は抽出対象外。
- 抽出方針: ログ全体をスキャンし、除外外のモデル名が登場する文脈を抽出。重複や文脈の薄いものはまとめ、関連するレス番号を記載。Wan2.2は除外リストに含まれないため抽出対象(Wan2.1とは別モデルとして扱う)。その他、Qwen、Animon、Vidu、HailuoAI、Veo3、musubi-tunerなどのモデル/ツールが登場するものを抽出。
- 追加情報: 各抽出項目で、モデルが選ばれている理由(もし明記されている場合)を強調。全体として、動画生成の文脈が多いため、それを中心に整理。
1. Wan2.2 (主に動画生成モデル、複数レスで議論)
- 関連レス: 256, 269, 275, 291, 298, 303, 305, 306, 307, 311, 320, 324, 325, 326, 328, 334, 345, 349, 364, 380, 387, 391, 393, 395, 396, 397, 398, 407, 411, 412, 415, 416, 417, 420, 424, 430, 439.
- 抽出内容: Wan2.2は動画生成の主力モデルとして頻繁に言及。主にComfyUIやEasyWan22経由で使用され、テキスト-to-ビデオ (T2V) やイメージ-to-ビデオ (I2V) をサポート。720P解像度で24fps対応(ただし14Bモデルは16fpsが正しいとの指摘あり、275)。GGUF量子化版 (387, 420) で低スペック環境でも動作可能。LoRAなしで高品質なエロ動画生成が可能 (299, 304, 336, 396, 397) で、舌の描写やおっさんのリアルさが高い (397)。中国語プロンプト拡張 (256, 266, 271, 276, 279, 283) でプロンプトの精度が向上し、英語より詳細な表現が可能 (例: Goblinの動作が正確に反映、266)。学習時間は長めだが (411, highモデル20時間)、おっぱいの張り表現が向上 (412)。
- 選ばれている理由:
- 高性能でローカル無料生成が可能 (309, 312)。Wan2.1より進化し、プロンプト忠実度が高く、LoRAなしで精細描写 (396, 397)。低スペック (例: VRAM12GBで45分生成、320) でも回るため初心者向け (303, 349)。中国語拡張でプロンプトのニュアンスが汲み取りやすい (440)。アニメ風動画のカスタマイズ性が高く、自然な動きを実現 (393, 395)。
- 課題点: 目や口の崩れが起きやすい (306, 345, 346)、量子化でプロンプト理解力が低下 (420)。
2. EasyWan22 (Wan2.2ベースのワークフロー/モデル拡張、zuntanニキ提供)
- 関連レス: 256, 291, 303, 305, 320, 325, 326, 328, 334, 349, 357, 359, 361, 366, 408, 422, 425, 426, 428.
- 抽出内容: Wan2.2をベースにした初心者向けワークフロー。アップデート頻度が高く (291, 359, 422)、Endimage指定やフレーム補完 (357)、翻訳機能 (328) を搭載。LoRAなしで動画生成可能 (305, 334)。アップスケールや補完でノイズを抑え、自然な動きを実現 (337, 408)。
- 選ばれている理由: 初心者でも扱いやすく、ComfyUIのガチ初心者向け (361, 366)。ノードが整理され、生成に専念可能 (366)。中国語プロンプト拡張対応で便利 (256, 325)。zuntanニキの頻繁な更新で使い勝手が向上 (422)。
3. Qwen (中国語プロンプト拡張用LLMモデル)
- 関連レス: 256, 266, 271, 279, 283, 286.
- 抽出内容: Wan2.2のプロンプト拡張に使用。中国語でプロンプトを自動生成し、詳細な動作を追加 (例: Goblinのセックスシーンで喘ぎ声や抵抗を反映、266, 271)。英語より中国語の方が精度が高い (256, 279)。日本語プロンプトを中国語に変換して使用 (283)。
- 選ばれている理由: 中国語拡張でプロンプトの忠実度が向上 (256, 271)。Wan2.2との相性が良く、ヘボい英語訳より詳細表現が可能 (256)。小さいモデルだと日本語が微妙なのでAPI推奨 (286)。
4. Animon (アニメ動画生成モデル、Wan2.1カスタマイズ版)
- 関連レス: 393, 395.
- 抽出内容: AlibabaのWan2.1をカスタマイズしたアニメ特化モデル。「Ruyi」モデルと組み合わせ、自然なアニメ動画生成 (395)。無料版で生成可能だが待機時間あり、動きがやや不自然な場合も (395)。
- 選ばれている理由: アニメっぽい自然な表現が可能 (393, 395)。Wan2.2のカスタマイズ候補として言及 (395)。
5. Vidu / HailuoAI (アニメ動画生成モデル/サービス)
- 関連レス: 393, 395.
- 抽出内容: Animonと並んで自然なアニメ動画生成に強い (393)。Viduの例で自然な動きを実現 (393)。
- 選ばれている理由: アニメ動画の自然さで優位 (393)。Wan系統よりアニメらしい表現が可能。
6. Veo3 (動画生成モデル、プロンプトJSON対応)
- 関連レス: 363.
- 抽出内容: プロンプトをJSON形式で記述可能。
- 選ばれている理由: JSON入力で詳細制御が可能 (363)。Wan系統の代替として言及。
7. musubi-tuner (Wan2.2学習ツール)
- 関連レス: 411, 412.
- 抽出内容: Wan2.2学習に暫定対応。LoRA学習でぶっかけ表現など強化 (411)。high/low側学習で時間かかるが (high20時間)、出力確認に有効 (412)。
- 選ばれている理由: Wan2.2のLoRA効きを改善 (411)。VRAM消費はWan2.1並みで扱いやすい (411)。
8. その他のモデル(SD関連など、除外外の言及)
- 関連レス: 331 (SD1.5), 338, 339, 344 (SD3), 347 (目のLoRA), 348 (danbooruタグ対応LoRA), 406 (SDでエロ禁止の議論), 433, 435 (NAIだが除外のため最小限), 438 (SDモデルロード時間).
- 抽出内容: SD1.5は瞳描写が初期レベル (331)。SD3以降でエロ規制の可能性 (339, 406)。目のLoRA学習で低学習率推奨 (347)。danbooruタグでキャラLoRA作成 (348)。
- 選ばれている理由: SDはエロ生成のベースだが、動画移行で使用減 (340, 406)。Wan代替としてエロ可能 (406)。
全体の考察
- このログはWan2.2を中心とした動画生成の議論が主流。除外リスト外のモデルとしてWan2.2が圧倒的に多く、理由は「ローカル無料」「高忠実度」「中国語拡張の利便性」にある。初心者向けのEasyWan22が人気で、zuntanニキの貢献が目立つ。中国語プロンプトの利点 (詳細表現の向上) が複数指摘され、モデル選択の鍵となっている。
- 抽出件数が多かったため、関連レスをまとめました。不明点があれば追加のログや詳細を教えてください。