以下は、提供された5chログ(445〜647)から、指定された生成AIモデル(NovelAI (NAI), Pony, illustrious(イラストリアス, リアス,ill,IL), Noobai, FLUX, Wan, Qwen)に関する話題をすべて抽出・整理したものです。抽出の基準は以下の通りです:
- 各モデルの言及(モデル名、バージョン、関連LoRA、ワークフロー、問題点、比較など)を対象とし、ログのレス番号を明記。
- 特に、そのモデルが選ばれている理由(性能、VRAM効率、品質、互換性、開発加速など)が述べられている場合、それを強調して抽出。
- ログ内でこれらのモデルに直接関連しない話題(例: Grok, Sora2, seedVR2, RVCなど)は除外。
- 抽出はモデルごとにグループ化し、ログの順序を維持。
- 注意: Noobaiとillustrious(ill,IL)に関する言及はログ全体でゼロでした。したがって、これら2つは抽出結果に含まれません。
NovelAI (NAI)
- 474: NAI v5の話とかはそろそろ出てこないのかな。NAIのモデルデータをNano Bananaレベルで動かせるようになればワイ的にはゲームエンドやな。
- 選ばれている理由: ローカルで高性能に動かせるようになれば、ユーザーの「ゲームエンド」(満足して終了)になるほど理想的。v5のリリース期待があるが、可能性は低い。
- 478: NAIはv5どころかサ終のが可能性高そう。大金突っ込んでモデル作るとも思えんし。
- 選ばれている理由: なし(むしろ開発停止の懸念が強いため、選ばれにくい)。
Pony
- 460: 1週間ぶりにスレ開いて過去ログまで見たけどpony7はアカンかったか。
- 選ばれている理由: なし(失敗したというネガティブな評価)。
- 506: pony v7を使ったオンラインサービスがあるんだな。値段までは見なかったけど。
- 選ばれている理由: オンラインサービスとして利用可能(ローカル以外の選択肢)。
FLUX
- 584: ワイはFLUXは使ってないので確認できないが、FLUXのloraでも同じ事が起きてるらしい。
- 選ばれている理由: なし(ComfyUI v0.3.67との互換性問題が指摘されている)。
Wan
Wan関連の言及が最も多く、VRAM効率、品質向上、LoRA互換性、ワークフロー最適化が主な話題。選ばれている理由として、低VRAM環境での実用性や動画生成の精度が頻繁に挙げられる。
- 445: 別にWANとかが中国で一番性能いい奴とかいうわけではないので好きに研究して貢献してもええぞ。
- 選ばれている理由: 中国最高性能ではないが、オープンソース的に研究・貢献しやすい。
- 471: WAN 2.2 SmoothMixAnimetionStyle i2v v0.9.1β(16GB/128GB以上あったほうがいいかも)。DisTorch2MultiGPU & TensorRT & WanVideoNAG 三段サンプラー。Wan2.2 fp16とSmoothMix AnimetionStyle LoRAの組み合わせ(動画にワークフロー付き)。
- 選ばれている理由: VRAM16GB以上推奨で動画生成が可能。fp16モデルとLoRAの組み合わせで精度追求(28GBモデル使用)。
- 480: SmoothMixならGGUF使ってみたらどう? I2Vはココ。T2Vはココ。
- 選ばれている理由: GGUF形式で低VRAM環境(12GB/128GB)向けに最適化可能。
- 481: ワークフローでどうこうなるもんでもないような。ダメやったらfp8使用してクレメンス。ちなみにComfyUIのバージョンをv0.3.62からv0.3.66に上げたらVRAMに割り振れる量が2GBぐらい増えたんで生成に必要なVRAMの消費が減ってるのかもしれんで。
- 選ばれている理由: fp8でVRAM消費を抑えられる。ComfyUIアップデートでVRAM効率向上。
- 483: 12GB民はLow側のモデルを大人しくfp8にすれば12GB&メモリ96GBでも普通に動くで。
- 選ばれている理由: fp8で低VRAM(12GB)環境でも動作可能。
- 485: clip_vision_hってcomfyのテンプレートやkijai版やと使われてないんやけどsmoothmixの作者は入れてるから何か効果があるんかなぁ。
- 選ばれている理由: SmoothMix作者が使用するclip_vision_hで何らかの効果(品質向上?)が期待される。
- 487: wan2.2でフラットな線画でも立体感のあるカメラワークができるかテスト(大丈夫)。
- 選ばれている理由: フラット線画でも立体感のあるカメラワークが可能(テストで確認)。
- 488: 中国発の動画ならviduやhailuoのがwanより相当先進んでる。今から勝負するならローカルでオープンにしつつ頃合いを見てクラウドに…。
- 選ばれている理由: ローカルオープンソースとして開発加速可能だが、他の中国モデル(vidu, hailuo)より先進度が低い。
- 492: smoothmixstyleなのにhighもlowもwan2.2使うんか? loraにsmooth mix animationstyleがあるが環境変わったんやろか。
- 選ばれている理由: High/LowでWan2.2を使用し、SmoothMix LoRAでアニメーションスタイルを強化。
- 493: WAN2.5がとうにクラウドでリリースされてるからもうローカル向けにばら撒く気は無いと思うで。
- 選ばれている理由: Wan2.5はクラウド向けでローカル版の期待薄(開発意欲の欠如)。
- 494: 「精度的にfp16+SmoothmixLoRAのほうがいいよね」という精度追求ワークフローだよ»471は(fp16モデルが28GBでSmooth mixは20GB) 基本ベースはSmooth mixの作者のワークフローがあって、素直にハイローSmooth mix wan2.2モデルを2段サンプラーでやるのが基本。その基本で品質に満足できない場合に3段サンプラーだとかFP16モデルを持ってくるというテクニック。
- 選ばれている理由: fp16+SmoothMix LoRAで精度が高い。基本は2段サンプラーで十分だが、品質追求で3段やfp16を使用。カメラ固定なら2段が安定。
- 498: どんどん肥大化してるからwan2.5ローカル落ちしても動かんのやないか。
- 選ばれている理由: なし(モデル肥大化でローカル動作が難しくなる懸念)。
- 500: 無理してモデルだけfp16にして高速化モリモリにするより fp8でもcfgやstepや解像度にRAM回した方が満足いくもんはできるで。あとはもう結局LoRAやね。
- 選ばれている理由: fp8でRAMをcfg/step/解像度に割り振ると満足度が高い(fp16の高速化より実用的)。
- 501: BaseモデルとしてはWan2.2がこれからしばらく現役な気がする。今は基本高速化ありきで犠牲になってるところはちゃんと犠牲になってるから、その辺を犠牲なく効率化(?)するだけでもまだまだ進化の余地はある。
- 選ばれている理由: Wan2.2がベースモデルとして現役。効率化の余地があり、進化可能。
- 502: easywanでggufモデル使ってた頃は変色ノイズ出まくりであかんかったな。姫騎士ニキのloraの出来が良すぎて助かっとるがもしなかったらsmoothmixwanが出るまで動画触らんかった気がするで。
- 選ばれている理由: GGUFでノイズ問題があったが、SmoothMixWanとLoRAで動画生成が実用的になった。
- 515: wanとかってこういう2コマ物も別々に動かすことができるん?
- 選ばれている理由: 2コマ動画を別々に動かせる便利さ。
- 555: 頼む赤ちゃんなんでSmoothMixのGGUFの使い方教えてくれんか? 例えば»518の動画をcomfyuiにドラッグアンドドロップして出てきたワークフローで GGUFを使いたい場合ってどこにどんなノードを追加したらいいんや?
- 選ばれている理由: GGUFでRAM64GB/VRAM16GB環境に対応(低リソース向け)。
- 563: 3段サンプラーって単に一つサンプラー追加するだけでええの? smoothmixなら合計6だからHigh1-High1-Low4でええんか?
- 選ばれている理由: SmoothMixの6ステップで低VRAM/高品質(数分で生成可能)。
- 583: comfyUIの0.3.67はwan2.2のモデルにwan2.1用のloraを使ってるとエラーになることがあるな。具体的にはanime-better-faceがダメだった。
- 選ばれている理由: なし(Wan2.2とWan2.1 LoRAの互換性問題)。
- 597: Smooth mixの合計6ステップは、低VRAMで数分で生成可能で品質も実用圏内というベースだから6にこだわる必要はない。品質上げたいなら2段サンプラで4+4や5+5に上げるというのがまず先。それでもカメラワークや背景の動きはでないから、それをどうにかしたくなったら3段サンプラーの登場。
- 選ばれている理由: 低VRAMで実用品質。カメラワーク向上のため3段サンプラー使用(ステップ調整で柔軟)。
- 617: Wan2.2 4stepでスカートたくし上げると腰でスカートが消える… つまり4stepのままずっとプロンプト練ってても埒が明かない。頑なにおっぱいが揺れないのもそういうところが原因だったりする。
- 選ばれている理由: 低ステップ(4step)で破綻しやすいが、10stepで詳細表現(スカート/パンツの動き)が向上。
- 618: WAN2.2のガラスキスLora使ったらそれっぽいの作れた。
- 選ばれている理由: LoRAで特定の表現(ガラスキス)が可能。
- 621: Wan2.1のLoRAをWan2.2で使うときはHighのstrength = 3, Lowのstrength = 1ぐらいで使うと良いらしいと聞いて他のWan2.1用のLoRAはそれで使えてたからコレも行けるかと思ったけど試してないんですんません。
- 選ばれている理由: Wan2.1 LoRAをWan2.2で互換使用可能(strength調整で効果的)。
- 625: ちょっとWAN2.2のi2vで使ってみたけどガラスに押し付けてくれないな。
- 選ばれている理由: i2vで動画生成可能だが、特定の動作に限界。
- 636: Qwen系とWan系の本体モデルはsafetensorsでもggufでも、とりあえず「models\diffusion_models」に全部ぶち込んで動いてる。
- 選ばれている理由: safetensors/ggufの柔軟な配置で動作。
- 644: simplecomfyuiやとqwen.batでqwenggufモデルダウンロードしたらそこに入っとるっぽいが diffusion_modelsだけじゃいかんのか?
- 選ばれている理由: GGUFモデルをunetフォルダに配置で動作(環境依存)。
Qwen
Qwen関連は主に画像編集やLoRAの互換性。選ばれている理由として、ステップ調整による品質向上や高速化が挙げられる。
- 448: オープンにすることでQwenを使用した画像生成の新たな論文が出たり 有用なLoRAを本体が取り込んで開発を加速したりする場合もある。
- 選ばれている理由: オープンソースで論文/LoRA取り込みにより開発加速。後発モデルとして草の根知見を集めやすい。
- 522: Qwen-Image-Edit-2509で遊ぼうと思ったら公式WFでもモザイクみたいなグチャった絵しか出ん。何が悪いんや。
- 525: 違うQwen-Image-Lightning-4stepsを試してみるとか step数を2とか減らしてみてみると結果が変わると思う。
- 選ばれている理由: Lightning-4stepsで高速化/破綻回避可能。
- 535: 最近Qwen2509でアプスケしてたけどseedVR2試してみるわ。
- 選ばれている理由: アプスケ(アップスケール)で使用(品質比較のため)。
- 634: QwenImage-EditのNunchaku版、Lora使えたらなぁ…と思ってたらもう使えるようになってたんやな。専用のLoaderが必要らしいんで、↓のを使った。RTX5xxx世代は高いstepsでも実用的な速度で生成できるので助かるわ。
- 選ばれている理由: Nunchaku版でLoRA使用可能。RTX5xxxで高steps/高速生成。TripleKSamplerで画質/動きの良いとこ取り。
- 636: Qwen系とWan系の本体モデルはsafetensorsでもggufでも、とりあえず「models\diffusion_models」に全部ぶち込んで動いてる。
- 選ばれている理由: safetensors/ggufの柔軟な配置で動作。
- 644: simplecomfyuiやとqwen.batでqwenggufモデルダウンロードしたらそこに入っとるっぽいが。
- 選ばれている理由: GGUFモデルダウンロードで簡単動作(qwen.bat使用)。
以下は、提供された5chログから、生成AIの「モデル」に関する話題を抽出したものです。抽出の基準は以下の通りです:
- 生成AIのモデル(例: Stable Diffusion系、LLM系、動画生成モデルなど)に関する言及を対象とし、除外リスト(NovelAI (NAI), Pony, illustrious(イラストリアス, リアス,ill,IL), Noobai, FLUX, Wan, Qwen)に該当するモデルは除外。
- LoRA(Low-Rank Adaptation)関連の話題は、モデルに適用される技術として関連性が高いため含む。ただし、除外モデルに適用されるLoRA(例: Wan用のLoRA)は除外。
- モデルが選ばれている理由(例: 性能、互換性、品質など)が明記されている場合、特に抽出して強調。
- ツール(例: TensorRT, ComfyUIのバージョン、Pytorchなど)はモデル本体に関する話題でない限り除外。
- ログのレス番号を参考に、関連部分を引用・要約して整理。重複を避け、関連性の高いものを優先。
抽出されたモデル関連の話題
1. SD1.5とSDXL(Stable Diffusionのベースモデル)
- 関連レス: 455, 456, 462, 464, 467, 482
- 抽出内容:
- SD1.5の頃はLoRA Block Weight(LBW)がリスト化され効果的だったが、SDXLになってからLBWの有効性が不明瞭になり、活用が難しくなった。SDXLではLoRAの効果が特定のブロックに集中するため、LBWで分けられにくくなった。
- SDXLでLoRAから画風を抜いたり、逆に画風だけにしたりするには、UnetやTextEncoderを調整する必要がある。CLIPとMODELの調整を分離して細かな制御を行う人もいる。
- SDXLで1.5時代のようなLBWを使う場合、start/stopパラメータを活用(例: 画風LoRAならstart, 構図LoRAならstop)。
- 選ばれている理由: SD1.5はLBWの効果が高く過去に活用されていたが、SDXLに移行後はLBWを使わなくなる人が増え、代わりにUnet/TextEncoderの調整やstart/stopで対応。SDXLのLoRA効果の集中が理由で、細かな調整が難しくなったため。
2. Sora2(動画生成モデル、OpenAIのSora関連?)
- 関連レス: 452, 507
- 抽出内容:
- 全盛期Grokのエロ性能と全盛期Sora2の声優性能を併せ持つモデルが出てほしいという願望。エロ無しならSora2で十分という意見。
- 選ばれている理由: エロ無しコンテンツではSora2が十分に高性能で、エロ作成に飽きた場合の代替として選ばれる。声優性能が高い点が魅力。
3. Grok(xAIのモデル、Grok3/Grok4など)
- 関連レス: 452, 470, 527, 529, 533, 537, 543, 545, 546, 547, 548, 551, 552, 553, 554, 556 (注: ログの561は動画URLだがGrok関連), 569, 570, 571, 572, 573, 575, 576, 578, 579, 581, 587
- 抽出内容:
- Grokで実写の暴力・死体・損壊などのグロ表現が可能(例: 手品失敗、拳銃自殺、人肉食、首吊り、開腹手術)。二次エロは排斥されるが、ゴア表現は無罪で出力可能。Grok4(パープレ経由)で動画生成や高解像度画像(2048x2048)が出力可能になり、版権キャラ(例: 鬼滅の刃の竈門炭治郎、禰豆子、けいおん!、ラブライブ、まどマギ、リリカルなのは、原神の一部キャラ、艦これの金剛)も生成可能。Grok3では版権が制限されていたがGrok4で緩和。スカートたくし上げやI字バランス、dry humpingなどのポーズもガチャ次第で出力。乳吸い動画などのエロ表現も規制前に作成可能。
- Grok Imagineで直接3:2横向き画像や動画出力が可能になり、進化が早い。
- 選ばれている理由: グロ表現(暴力・ゴア)が大っぴらに可能で、ホラーやインモラルなコンテンツに強い。版権キャラの出力が比較的緩く、エロ画像/動画のガチャに活用(例: 瞳形状の当たりを引くまで50回生成)。二次エロは制限されるが、規制の抜け道(例: スカートたくし上げ専用)として選ばれる。進化が早く、負荷が増えても素直な出力が期待される。西洋圏のポリシーで二次エロよりゴアが許容される点が特徴。
4. SeedVR2(アップスケール/動画処理モデル)
- 関連レス: 484, 487, 508, 531, 534, 535, 536, 538
- 抽出内容:
- 動画のアップスケールに使用し、品質が非常に高い(特に三次系)。内部的に専用モデルでV2V(Video-to-Video)を実行。二次系動画はメリハリが付きすぎてイマイチだが、三次系に強い。静止画ではGAN系の方が良い場合もある。生成時間は長い(5秒動画で分単位)。
- 選ばれている理由: 品質が別次元レベルで良いため、とっておきの画像/動画に選ばれる。三次系に強く、内部V2Vで高品質化が可能。ただしVRAM消費が厳しく、VAE Tiling(nightly版)で緩和。速度より品質を優先する場合に選択。
5. SmoothMix(アニメーションスタイルのモデル、GGUF版含む)
- 関連レス: 471, 480, 483, 492, 494, 496, 502, 555, 563, 597, 634 (注: Wan関連だがSmoothMix自体は除外リスト外)
- 抽出内容:
- SmoothMix AnimationStyle LoRAとの組み合わせで動画生成。GGUF版を使用する場合、Unet Loader GGUFで読み込み(例: models/unet/やdiffusion_modelsに配置)。fp16+SmoothMix LoRAの方が精度が高い。3段サンプラー(例: High2-High2-Low2)でカメラワークを向上。合計ステップを6から増やす(例: 4+4や5+5)で品質向上。
- 選ばれている理由: 低VRAM(例: 12GB/96GB)で数分生成可能で実用性が高く、品質が良い。カメラ固定のイラスト構図なら2段サンプラーで十分だが、動きを求める場合3段に拡張。fp16版が精度追求に適し、GGUF版はRAM64GB環境で推奨(変色ノイズが出にくく安定)。基本ワークフローが高速で、品質に満足できない場合にfp16や3段サンプラーで調整可能。
6. Anime-Llasa-3B-Captions(キャプション生成/学習モデル、Llamaベース?)
- 関連レス: 447, 477
- 抽出内容:
- 音声データを含むparquetを基に学習/出力。text, wav, codeを含むjsonl形式で処理。キャプションやemotionの配列を作成して変換。
- 選ばれている理由: LLM系の学習が初めての人でも扱いやすく、リアス(除外)以外のキャラLoRA作成経験で対応可能。音声関連のシンプルな構造で、InfiniteTalkとの組み合わせで動画生成に活用。
7. その他のLoRA関連(一般的なLoRA Block Weightや調整)
- 関連レス: 453, 454, 455, 462, 464, 467, 490, 504, 617
- 抽出内容:
- LoRA Block Weightの情報がネット上で少なく、プリセット効果の詳細が不明。SD1.5/SDXLで検証が必要。Multiple-angles LoRAをLoRA Loaderで連結。4step LoRA(Kijai版やlightx2v版)で高速化。ステップ不足でプロンプトが破綻する場合あり(例: 4stepでスカートが消えるが10stepで正常)。
- 選ばれている理由: 画風/構図の抽出に有効だが、情報不足で自己検証が必要。SDXLではブロック集中のため調整が難しく、start/stopで対応。高速化LoRAはステップ不足の破綻を防ぎ、品質向上に選ばれる(例: Kijaiの新版で有用)。
抽出の補足
- 全体の傾向: ログはWan/Qwen関連が多いが除外したため、Stable Diffusion系(SD1.5/SDXL)とGrokの話題が中心。理由として挙げられるのは、品質/速度のバランス、VRAM消費の低減、表現の自由度(例: Grokのグロ対応)。
- 理由の抽出基準: 明示的に「選ばれている理由」(例: 品質が高い、VRAMが低い、表現が可能)が述べられているものを優先。
- 該当なしのレスは抽出対象外(例: ツール中心の508, 514など)。もし追加の文脈が必要なら、さらなるログを提供してください。