以下は、提供されたログ(651〜851)から、指定された生成AIの「モデル」に関する話題をすべて抽出したものです。抽出の基準は以下の通りです:
- 対象モデル:NovelAI v4もしくはv3 (NAI), Pony, illustrious 0.1,1.0,1.1,2,3,3.5vpred (イラストリアス, リアス,ill), Noobai, FLUX, HiDream, Wan 2.1,2.2 (wan), FramePack
- ログ内の関連する言及を、モデルごとに分類してまとめました。各モデルの話題を時系列順に抽出。
- 特に、そのモデルが選ばれている理由(例: 性能、使いやすさ、エロ対応、再現性など)が明記されている場合、それを強調して抽出。
- ログ内でこれらのモデルに直接関連する話題のみを抽出(QWENやSDXL本体などのリスト外モデルは、指定モデルとの比較や関連で言及されている場合のみ間接的に含むが、焦点は指定モデルに置く)。
- 抽出はログの番号を引用し、簡潔に要約。重複する話題は統合して記述。
NovelAI v4もしくはv3 (NAI)
Pony
- 674: 魔人ponyからもう1年半以上経つと忘れられるんやろな(SDXLのNSFW去勢に関する文脈で、Ponyの登場を歴史的に振り返る)。
- 675: PONY出たら秒で移行したけど、まんまんが綺麗に出るXLってあったんやな(選ばれている理由: まんまんが綺麗に出るため、SDXLからPonyへ即移行した)。
- 678: animagineとponyが結局上手くいった感じや(選ばれている理由: SDXLでのNSFWとdanbooruタグ学習がハードル高い中、ponyがマシンパワーでゴリ押しして成功したため)。
- 679: Ponyは癖が強いからSD1.5に戻って、使いやすいPonyの派生モデルが出てLORAの再現度が良かったからやっと移行した感じだなぁ(選ばれている理由: 派生モデルの使いやすさとLORA再現度の良さで移行。元のPonyは癖が強いため敬遠)。
- 682: エバラponyが転機やった(選ばれている理由: SDXLのお通夜状態を打破する転機となった)。
- 684: ponyも音沙汰無いし(最近の進展なしの指摘)。
- 714: ponyは最近だと昨日ディスコのgeneralスレッドに進展っぽいお知らせがあったな。翻訳文からだとV7のオープンリリースがもうすぐらしい。でも結構前から出る出る言われているけど全然出ないから今回のお知らせはどうなるか(V7リリースの可能性について)。
illustrious 0.1,1.0,1.1,2,3,3.5vpred (イラストリアス, リアス,ill)
- 658: リアス0.1の再現性0だった背景のイラストをGPTに自然言語化させてqwenで出し直す(illustrious 0.1の再現性が低いため、QWENで代替生成)。
- 665: イラストリアスのお手軽版権キャラやエロ体位が強すぎた感ある(選ばれている理由: お手軽版権キャラやエロ体位の強さ)。
- 669: イラストリアスXLはSDXLのファインチューニングモデルだから qwenとイラストリアスXLを直接比較するのはレイヤーが違ってて、qwenでファインチューニングしたイラストリアスQWENが最強になる 学習コストがアホみたいに上がってるから「で、来るの?」って話ではある(選ばれている理由: SDXLのファインチューニングモデルとして優秀。QWEN版が最強になる可能性)。
- 677: Qwen版リアス+低VRAMでも動かせる環境の整備+およびそれらがまとめられたWebUI これで覇権確定や!(QWEN版illustriousの期待)。
- 681: 今のリアスを状況を見るとね…(現在のillustriousの状況が微妙との指摘)。
- 683: リアス本体はかなり微妙やし じゃあリアス系モデル作者が素のSDXLからそれ作れるのか言うたら絶対無理やし 間に企業パワー一個挟んどるのが大きいんやろか(選ばれている理由: 企業パワーによる優位性。ただし本体は微妙)。
- 693: 英雄リアスが世界中から石投げられていて草やったな(illustriousの作者が中指立てられるエピソード)。
- 694: リアスは方針変更でもしないと、3.0以降は存在していないようなもんだからなぁ 支援でお金貰ってるから簡単に方針変更はできないかもだけど(3.0以降の存在感薄れ、方針変更の難しさ)。
Noobai
- 684: noobのところがqwenに学習してくれたらとは思うけど残念ながらnoobのところは2025年以降は画像生成AIじゃなくてマルチモーダルなAIに手を出すと言ってるからなぁ(Noobaiの今後がマルチモーダルに移行するため、QWEN学習の期待薄)。
- 692: onomaaiくん立ち回りが下手くそすぎてな XLもいよいよ先が見えてきたし(Noobai関連のonomaaiの立ち回りが下手との指摘。XLの限界)。
FLUX
- 825: 「ベースモデルと比較するのは間違っている。ちゃんと学習されたモデルが出ればSDXLを超えたエロだって出せる」なんてのはSD3の時もFluxの時も散々聞いたからな どうせ今回もそうなるんだろって思うのは無理はないと思うで(FLUXの登場時、エロ対応の期待が外れた過去の例として言及)。
HiDream
- 739: Wan2.2で最終フレームから繋いで行くのHiDream I1の絵でも概ね成功 Wan2.1ではうまく動かなかったので僥倖 調子こいて30秒まで延長したけどちょっと無理があるかも で遅ればせながらQwenをいじる時間ができたのでセットアップして少し試してみたけど他のニキが言うようにSeed変えても同じような構図が出ることが多いね HiDream I1の蒸留版dev, fastと同じような感じやけど蒸留なんかな?と思ったけど高速化LoRAのせいかもしれないと思ってComfy謹製のWorkFlow(LoRAなし)だと多少変化が出るみたいだった あと顔がHiDreamに比べてフラットと言うか表現が弱い感じがするけどこれはプロンプト工夫したら変わるのかな?(選ばれている理由: Wan2.2との連携で成功。顔の表現がフラットだが、プロンプトで改善可能)。
Wan 2.1,2.2 (wan)
- 653: »370 の何にでもGeneral NSFWの続きをEasyWan22サンプルに追加しといたで これでラスト 雑に使えるんはよかったで(EasyWan2.2のサンプル追加。選ばれている理由: 雑に使える良さ)。
- 662: ワイもqwen出せるようになったからwanで回したでー(Wan使用)。
- 667: 動画のendImageを参考にstartもqwenで作ったけど左右の立ち位置はもちろん 変テコな水着の部位指定を何度も「しっかり守る」qwenは賢いな それを綺麗につなげるwanの一貫性保持は魔法みたいなもので、qwen・wanは協力なタッグやなと思うわ(選ばれている理由: QWENとのタッグで一貫性保持が優秀)。
- 706: 1080でwan2.2動かしたら200行くらいエラー出たけど動画出来てるしいいか4stepで1本40分かかる(Wan2.2の動作確認)。
- 717: EASYWan22にどうやってlora入れて適用するのかね?(EasyWan2.2のLoRA適用方法)。
- 720: qwenの点乳首でもwanなら書き足してくれるの助かる(選ばれている理由: QWENの不足を補完)。
- 726: Wan22ちゃん口パク抑える方法ないんか?(Wan2.2の口パク問題)。
- 731: Wan2.2は感覚だと上位モデルなら口パクしないね fp8やfp16はネガ入れとけば余計な動きがほぼなかった(選ばれている理由: 上位モデル(fp8/fp16)の口パク抑制性能)。
- 732: EasyWan22のComfyUIをv0.3.50にPyTorchを2.8.0にCUDAを12.8に上げといたで(EasyWan2.2のアップデート)。
- 734: easy wan2.1に触れたとき、これからは動画や!… wan2.2において元画像はアプスケして大きくする方がええのか、それとも、1024*1024の解像度のままでええやろうか?(選ばれている理由: 動画生成の可能性。Wan2.1から2.2への移行で解像度アドバイス募集)。
- 735: Wan2.2の口パクは量子化&高速化あたりの代償にはなってそうな気はするな(口パクの原因分析)。
- 738: Wan2.2でLoRAを適用させて一枚絵を高速生成するT2iみたいな 猿でも使えるワークフローはありますかね?(Wan2.2の高速T2Iワークフロー募集)。
- 739: Wan2.2で最終フレームから繋いで行くのHiDream I1の絵でも概ね成功 Wan2.1ではうまく動かなかったので僥倖(選ばれている理由: Wan2.1より成功率高く、HiDreamとの連携良好)。
- 740: ワイは3060 12gにメインメモリ64g勢やけどeasywan22でQ8使ってるで!… Q8やと口パク率低くてキャラはよく動くし何よりカメラワークに大きな違いがある(選ばれている理由: Q8量子化で口パク低減、カメラワーク向上)。
- 744: Wan2.2-T2V-A14B-HighNoise-Q8_0.ggufとWan2.2-T2V-A14B-LowNoise-Q8_0.ggufをダウンロードしてきてdiffusion_modelsに収納(Wan2.2のQ8モデル設定)。
- 747: Wan2.2-I2V-A14B-GGUF… i.imgur.com/J11Hn1E.jpeg i.imgur.com/wp8w8Lz.jpeg 高速化LoRAは自分で設定せんとアカン(Wan2.2のI2Vモデルと高速化LoRA設定)。
- 752: EasyWan系なら「触る」ってほど大げさなもんじゃなくて、まずはStartImageのとこに画像をD&Dして生成ボタン押すとこまでいければどうにかなる(EasyWanの使いやすさ)。
- 764: なんかワイが作るとどうしてもカクカクになるな(Wan生成の品質問題)。
- 786: それは分からん 別のスレで誰かが貼ってくれたワークフローをいじって使ってる 同じ設定でやって検証してみて欲しい 何故か10秒になるから(Wanワークフローの検証)。
- 789: ちゃんと設定できてないからスローになっとるだけやで(Wan設定のアドバイス)。
- 794: うーむ…断面図loraもいれて動画生成したけど、断面図内のちんぽこが思ったように動かないんゴね…(WanでのLoRA動画生成の課題)。
- 798: Wan2.2のLoRAの効きの扱いにくさは高速化&量子化で犠牲になってるような気がするようなそうでもないような… でもEasyWan22の設定のままQ8にしただけで他の設定変えずだとメインメモリいっぱいになってSSDにおもらししてたので採用は見送り(選ばれている理由: Q8でLoRA追従性向上。ただしメモリ問題で採用見送り)。
- 799: wan t2xでも文字は出せるけどメリットと言えばそう(Wan t2xの文字生成能力)。
- 802: 泣きながら切り分けし続けてWAN2.2がradeon環境でも高速化のワークフローで動作できるようになったで(Wan2.2のRadeon対応)。
- 807: easywan22のデフォからモデルをQ8に変えただけやと高速化LoRAが外れてしまうから、それも自分で設定するんやで(EasyWan2.2のQ8設定アドバイス)。
- 810: easywan22のデフォからモデルをQ8に変えただけやと高速化LoRAが外れてしまう(同上)。
- 812: 試してみた 環境は4060ti16gb(13700F)と96GB 16フレーム5秒(81)6STEP Blocks ToSwap 20 640px メモリ最大地点55.1GB vram15.5(共有0.3)GB 総時間289.34(Wan2.2のメモリ使用テスト)。
- 814: あ、BlocksToSwap20で使ってるからvramギリギリというのはそれが絡んでるわ 初期の40なら余裕で足りると思われる(Wan2.2のVRAM設定)。
- 826: Q8に変えてプロンプトの効きが良くなるならと試してみたけどワイもやっぱり高速化LoRAの有効化で躓いた 有志のワークフローを待ちますわ…(Wan2.2のQ8と高速化LoRAの課題)。
- 838: Q8容量気になったんでQ6で妥協してみたけどあまり綺麗じゃないなぁ step6に変えてもダメならstep4Lora外してみるか(Wan2.2のQ6量子化の品質低さ)。
- 841: 動画どこまで大きいのいけるんやろって試しで1024*1024で回しとるけどvaeエンコがいつまで経っても終わらん、暇や(Wanの高解像度生成テスト)。
FramePack
これらの抽出はログの全内容を網羅的に確認した結果です。指定モデル以外の話題(例: QWEN単独の詳細)は除外しました。もし追加の文脈や不明点があれば、 уточнитеください。
—以下は、提供された5chログから、生成AIの「モデル」に関する話題を抽出したものです。抽出の基準は以下の通りです:
- 対象: 生成AIのモデル(ベースモデル、ファインチューニングモデル、LoRAなど)に関する言及。ログ全体をスキャンし、モデル名やその特性、比較、学習、移行などの議論を抽出。
- 除外: 指定された除外モデル一覧(NovelAI v4/v3 (NAI), Pony, Illustrious 0.1/1.0/1.1/2/3/3.5vpred (イラストリアス, リアス, ill), Noobai, FLUX, HiDream, Wan 2.1/2.2 (wan), FramePack)を厳密に除外。これらのモデルが言及されていても、その部分は抽出せず、他のモデルとの関連で最小限の文脈のみ残す。
- 抽出の焦点: 特にそのモデルが選ばれている理由(例: 自然言語理解の高さ、学習コスト、NSFW対応、移行のしやすさなど)が明示されている場合、それを強調して抽出。
- 構造: ログのレス番号を参考に、関連する話題をグループ化してまとめ。重複を避け、簡潔に記述。抽出対象が少ない場合でも、ログ全体から関連するものを網羅。
1. Qwen (Qwen Image) に関する話題
Qwenはログ全体で頻出するモデルで、自然言語理解の高さが主な選定理由として挙げられている。除外モデルとの比較が多いが、それらは除外し、Qwen自体の特性に焦点。
- 自然言語理解と生成の柔軟性: Qwen Imageは自然言語プロンプトをよく理解し、背景や構図を思い通りに出力可能(例: レイヤー構造を理解し、遮蔽物があっても一貫性を保つ)。理由: 素材生成として優秀で、これからに期待(665)。また、日本語プロンプトでもアニメ風の出力が可能で、文字反映や詳細指定が反映されやすい(658, 811)。選定理由: 背景のイラストを自然言語化して再生成しやすく、破綻が少ない(824, 842, 845)。
- LoRA学習とNSFWの可能性: Musubi Tunerを使ったQwen-Image LoRA学習が可能で、VRAM 12GB + メインメモリ64GBから学習できる(743)。理由: 低VRAMでもLoRA作成が可能になり、SDXLからの移行を促進(660)。NSFW対応の期待が高く、エロチューニングで帝国を築ける可能性(702, 788)。ただ、点乳首などのエロ要素は追加処理が必要(720)。
- ファインチューニングの期待: Qwen Image本体はSDXLのファインチューニングモデルと比較せず、Qwenでのファインチューニングモデルが出てから本番(819)。理由: 学習コストが高いが、エロ対応力が高まればSDXLを超える可能性(825)。自然言語でLoRAの出し入れが可能か検証中(805)。
- 出力の一貫性: 入力が同じなら出力が安定するのがAIとして望ましい(849)。理由: Seedを変えても似た構図が出やすいが、これは性能の良さの証拠(739)。
- その他の理由: 中国発モデルでデフォルトで日本寄りのアニメ絵が出せ、これで十分という層向け(827)。文字出力や構図制御がメリット(795, 799, 803, 818)。
2. SDXL に関する話題
SDXLはベースモデルとして頻出。除外モデルとの比較(例: Pony派生など)は除外し、SDXL自体のNSFW対応や移行の歴史に焦点。
- NSFW対応と学習の難易度: SDXLのベースモデルはNSFWデータが去勢されている(673)。理由: 当初エロが出にくくお通夜状態だったが、ファインチューニングで対応可能(682)。CounterfeitやKohakuはNSFW/danbooruタグ学習で苦労したが、animagineがマシンパワーで成功(678)。選定理由: エロ体位や版権キャラの再現が強い派生モデルが出て移行が進んだ(675, 679)。
- 移行のしやすさと資産: SD1.5からの移行で、資産(LoRAなど)を捨てる必要があったが、エロ対応で嫌でも移行(830, 834)。理由: 1.5は破綻しやすく、言うことを聞かないが、XLはまんまんが綺麗に出る(675, 835)。t2i性能が高く、i2i経由でキャラ/画風維持が可能(691)。
- 限界と将来: t2iは技術限界があり、複数人絡みは大金かけても実現しにくい(699)。理由: モデル性能向上より、技術革新待ち(699)。
3. SD1.5 に関する話題
SD1.5は古いモデルとして比較対象に登場。
- 資産の多さと限界: LoRAの再現度が良く、使いやすいが、破綻しやすい(679, 835)。理由: Pony派生が出て移行したが、1.5に戻る人もいるほど資産が多い(679)。XL移行で1.5の資産をXLで使えるようにするツール(xなんちゃら)がある(832)。
4. SD3.5 に関する話題
SD3.5はライセンス問題で言及。
- ライセンスの影響: animaestroがSD3.5のライセンス周りで勝手に死んだ(684)。理由: 開発が止まり、手が出しにくい(684)。
5. その他のモデル(Animagine, Kohaku, Counterfeit, DMD2)
これらはSDXL関連の例として登場。除外モデルとの比較は除外。
- Animagine: SDXLのNSFW学習で成功例。理由: マシンパワーでゴリ押し(678)。
- Kohaku / Counterfeit: SDXLのNSFW/danbooruタグ学習で苦労し、上手くいかなかった(678)。理由: ハードルが高く、初期に頑張ったが失敗(678)。
- DMD2: 高速化関連の歴史。理由: 出た当初は騒がれず、vpredと勘違いされたが、20-30ステップで画像生成が可能だった時代を変えた(836, 837)。
追加の洞察
- 一般的なモデル選定の傾向: モデルは学習コストが高く、エロ対応や自然言語理解が移行の鍵(676, 677, 819, 825)。ローカル向け画像生成は金がかかるメリットが少なく、偶然の産物(685, 688)。タグ付け方式 vs 自然言語のデータセット問題があり、自然言語で詳細再現が可能かが焦点(840)。
- 抽出の注意: ログの大部分が除外モデル(Wan, Illustriousなど)に関するもので、抽出量は限定的。除外モデルが選ばれている理由(例: 一貫性保持の優秀さ)は抽出せず、無視。もし抽出漏れや追加の文脈が必要なら、具体的に質問してください。