抽出結果: 指定モデルに関する話題一覧
ログ(4〜323)から、指定されたモデル(NovelAI (NAI), Pony, illustrious(イラストリアス, リアス, ill, IL), Noobai, FLUX, Wan, Qwen)に関する言及をすべて抽出。NovelAI (NAI) の言及はなし。各モデルの言及をレス番号順にまとめ、特に選ばれている理由や利点・欠点の言及を太字で強調。関連する文脈(例: 比較、使い方)も含む。
Pony
- 282: 「性能が悲惨すぎて誰も触ってないけど、一応次世代新モデルでちゃんとオープンで公開しきったのは偉いよな PONY Zponyで圧倒的な性能見せて手のひらクルーさせてくれ」
- 理由: 次世代新モデルとしてオープンソース公開を評価。Zponyで高い性能を発揮。
- 285: 「Illustlious系のponyとかanikawaは問題なく出力できている」
- 文脈: susamix v3/vpred1で出力可能(他のモデルで問題発生)。
- 286: 「ベースモデルをいきなり二次エロ学習させてもpony7のような結果になるんやろな」
- 文脈: Noobaiの文脈で、Pony7を「二次エロ学習の限界例」としてネガティブに言及。
illustrious (イラストリアス, リアス, ill, IL)
- 102: 「webuiとイラストリアスから逃れられない」
- 理由: 依存性が高く、手放せない(逃れられない=優位性が高い)。
- 261: 「Illustliousに次ぐローカルのブレイクスルーはいつ起きるんや」
- 文脈: ローカル環境のトップモデルとして位置づけ、次世代を期待。
- 285: 「Illustlious系のponyとかanikawaは問題なく出力できている」
- 文脈: susamix v3/vpred1で正常動作(他のモデルで失敗)。
- 286: 「リアスののような完全な二次調教したモデルを更にエロ強化したのがnoobなわけで リアスもkohaku XLベースやし」
- 理由: 完全二次調教モデルとしてベースが高評価。Noobaiの基盤。
- 291: 「リアスもkohaku XLベースやし…ってことは三度焼きが必要!?」
- 文脈: 高性能ベース(kohaku XL由来)をさらに強化の可能性。
- 294: 「いまさらなんやがリアスのLoRA作るときってタグ付けどうしとる? まだWifeDiffusionでも行けそうかな。」
- 文脈: LoRA作成時のタグ付けを議論。学習適性が高い。
Noobai (Noob, noobai, noobのlora)
- 79: 「結局noobのloraが一番クオリティが高いなってなったんやが 自然言語キャプションによる圧倒的な構図の自由度も捨てがたい」
- 理由: 最高クオリティのLoRA。構図自由度が高いが、自然言語キャプションとのトレードオフ。
- 286: 「リアスのような完全な二次調教したモデルを更にエロ強化したのがnoobなわけで」
- 理由: Illustrious(リアス)のエロ強化版として位置づけ。
- 311: 「noob学習で結構な汎用性を見せてくれたんで採用」
- 理由: 少ない枚数(9枚)で高い汎用性。ZIBのLoRA学習で参考。
- 313: 「animagine4やnoobaiみたいなチェックポイントの開発待ち」
FLUX (Flux, FLF2V? Flux Kleinなど)
- 80: 「WAN2.2ネイティブのFLF2Vの色変わりとかと違って」
- 文脈: WAN2.2との比較で、動画生成の最終フレーム問題(モザイク化)を指摘。
- 94: 「Flux Klein 4bオリジナル:… Chroma2-Kaleidoscope+klein4b_turbo_r128(Lora強度0.8): Klein 4bのもともとの性能のせいか奇形率が高いし指グチャ率も高い でもエロ描写絶対避けるマンからはかなり学習が進んでる」
- 理由/欠点: 奇形・手指グチャ高めが欠点だが、エロ描写を避ける学習が進んでいる利点。
Wan (WAN, wan2.x)
- 73: 「wan2.2も奥が深いでぇ」
- 文脈: フィニッシュ間際の「満面の笑み病」などの問題を指摘しつつ、深みを評価。
- 240: 「Wan2.1 + InfiniteTalkなら中国AIやから顔はええんやがリップシンクが少し甘くなる」「Wan2.2やからリップシンクや動きが改善するで」
- 理由: 顔生成優秀(中国AI由来)。Wan2.2でリップシンク・動き改善。
- 245: 「WAN2.2やからリップシンクや動きが改善するで end4フレームを破棄して繋げていったらええで」
- 理由: リップシンク・動きの改善で動画生成に適す。
- 258: 「wanで言うとこのpainterI2Vでmotion amplitudeを高くしすぎたみたいな動きになりがち」
- 265: 「素のWan2.2がいいかもしれない… 余韻の軽微な揺れならLowでもカバーできる」
- 理由: 動画余韻生成に適す(おっぱいカチカチ欠点あり)。
- 273: 「wanで言うと…motion amplitudeを高くしすぎたみたいな動きになりがち」
- 284: 「ワイはwaiのFT待ちや……やってくれると信じとるで」
- 文脈: Wan(wai?)のファインチューン(FT)を期待。
Qwen (Qwen系全般, QwenVL, Qwen3-VLなど)
- 31: 「sageattentionとか–fastとかfp4fp8特化ノードやコマンドはqwen系全部死ぬ z-imageも死ぬ」
- 35: 「qwenとzimageは虚弱体質だから生成オプションを付けると病院送りに ノードやモデルが対応しきれてない」
- 38: 「画像からプロンプトならQwen3-VLの方が優秀らしいから試してみ」
- 理由: 画像→プロンプト生成で優秀(Janus-Pro比)。
- 47: 「ComfyUI ManagerだとQwen 2.5 VLしかmodelがないな」
- 51: 「1038lab / ComfyUI-QwenVL のやつをカスタムノードフォルダでgitで」
- 53: 「QwenVLノードインストールして…自動でモデルがダウンロードされる」
- 54: 「QwenVLのGPUインストールに丸一日かかったンゴ」
- 55: 「custom nodes managerからインストールできたで」
- 60: 「Qwen3-VL-8B-Thinkingを使ってみた…ごついメカ腕までは再現できなかったけどなかなか」
- 66: 「Qwen3-VL-8B-ThinkingでPrompt Refine & Expand…5090でも200秒くらいかけて」
- 欠点: 小さいモデルはポンコツ(113で反復思考無駄)。
- 72: 「QwenVLで出力されるテキストが途中で切れる…max_tokensを増やせば?」
- 113: 「小さいモデルのThinkingはポンコツやから使わんほうがいい 多分それ反復して意味のない思考出力してる」
- 219: 「素材のキャプショニングにQwen2.5-VL-7B-NSFW-Caption-V4.Q8_0.ggufを使ってみたところ ちゃんとエロ用語も入れてくれていいな」
- 理由: NSFWキャプション優秀(エロ用語対応)。
- 220: 「QWENVL GGUF版かllama.cppのVRAM開放部の問題だから無理」
- 274: 「Qwenに比べるとLoRA作成コストが現実的でLoRAの挙動も素直」(Zimageの利点として)
まとめ洞察
- 最多言及: Qwen(インストール・使用・欠点多め)。プロンプト/キャプション生成で優秀だが不安定。
- 高評価モデル: Illustrious/リアス(二次調教・エロ基盤)、Noobai(クオリティ・汎用性)、Wan2.2(動画リップシンク)。
- 期待モデル: Pony/Zpony(オープン次世代)、FLUX(エロ学習進化)。
- 全体的にローカル環境(ComfyUI/A1111/reforge)との組み合わせが多く、動画/エロ/LoRA学習文脈が中心。理由は主に「クオリティ」「自由度」「動画適性」「エロ対応」。
抽出された生成AIモデル関連話題(除外モデル除く)
ログ全体をスキャンし、除外リスト(NovelAI, Pony, illustrious/イラストリアス/リアス/ill/IL, Noobai, FLUX, Wan, Qwen)に該当しないモデル名(または明確にモデルとして言及されるもの)に関する話題のみを抽出。ツール/UI(A1111, ComfyUI, reforge, forge, stability matrix, ai-toolkit, kohya, musubi-tunerなど)はモデル本体でないため除外。LoRA単体もモデルとして扱わず、関連文脈のみ記載。選ばれている理由や特徴言及があれば併記。
1. genie3 (15)
- 二次元の世界にダイブできたか?の使用報告。体験談募集。
2. musubi (16, 96)
- ファインチューン試験でVRAM32GB環境下、–full_bf16ありバッチ数2が限界。resolution 1024。
- musubi-tuner (96, 311): z-image画風学習で5e-4シフト値3.0、dim16が無難。1e-4で2.2は学習進捗遅く、dim16-32で恩恵なし。ZIB LoRA学習で使用(311: convert_lora.pyの場所注意、ベースモデルが足を引っ張る)。
3. trinart2 (17, 21)
- 元素法典が出た当時使用。元素法典的プロンプトをぶち込み。
- 生成物をJanus-Proに突っ込んでプロンプト生成後、ZI hiresで使用。
4. Janus-Pro / Janus-Pro-7B (21, 37)
- trinart2生成物からプロンプト生成に使用(なぜ和風に?)。
- メカ娘判定が難しい。ソースが悪かった可能性(画像からプロンプトならQwen3-VL推奨と返信)。
5. z-image / ZI / Z-image / ZIB / ZiB / zib / Z-Image (21, 26, 27, 29, 31, 35, 78, 88, 96, 223, 269, 271, 272, 274, 279, 283, 311, 312, 313, 314)
- 昔の生成物からプロンプト生成して再生成楽しい(26)。
- clip優秀でも自然言語でLoRA適用範囲決められず、detaler segsで解決可能(27)。
- qwen系/z-imageはsageattention/–fast/fp4fp8で死ぬ虚弱体質(31,35)。
- fp8/gguf比較でlowvram時gguf速い場合あり(36)。
- 選定理由/特徴:
- SD1.5同様強化学習なしでクリエイティブ向け(78)。
- SDXL次世代器として将来性高(性能段違い、LoRA作成コスト現実的・挙動素直・性器覚える、ライセンススッキリ・追加学習推奨)(274)。
- 生まれたばかり、半年-1年後SDXL代わり可能性(エロチューン待ち)(269,271,272,313)。
- 画風ブレ大、ファインチューン/LoRA待ち(279,283)。GGUFはQ5以上でないと劣化目立つ(314)。
- LoRA効き悪く2.0強調必要(312)。
6. PainterAI2V (39, 40, 80, 245, 273)
- 最後の数フレームが荒れる問題。エンドイメージ指定で荒れ、解決法なし(39,40)。
- WAN2.2ネイティブFLF2Vと違い最後4フレームモザイク(80)。
- motion amplitude高すぎで動き過剰(273)。
7. 元素法典 (17, 46)
- 昔trinart2で元素法典的プロンプト使用。懐かしい単語(waifuDiffusionと共に)。
8. waifuDiffusion / Waifu Lab / WifeDiffusion (17, 46, 57, 294)
- 懐かしい単語(元素法典と共に)(46)。
- LoRA作成時のタグ付けで今でも行けそう?(294)。
9. abyss orange mix / ghostmix (50)
- マージ作者がメディア出演。あの頃アニメ/実写最新モデルは日本発。
10. sdxl2-flat2-512b (LoRA, 59) / sdxl-flat / flat / boldline rola (63, 64, 97)
- 今でも現役(59)。
- 未だ使用、outlineも(63)。フラットロラはマイナス適用でディテール追加?(97)。
11. balloonmix (61)
12. HeartMula / HeartMuLa (30, 65, 88?)
- 既存曲歌詞英訳で生成、MV風動画狙い(30)。
- 演歌も行ける(65)。
13. grok / grok imagine video (70, 85, 101, 253, 258, 275)
- API使用、WEBよりモデゆるい。480p1秒0.05ドル+元絵0.002ドル(高め?安め?)(70)。
- 動画API高く高速ガチャ感覚で万円行きそう(101)。
- 喘ぎ声台詞だけでそれっぽい動き、日本語音声上手くなった(253,258)。
- エロ出せるようになりクラウド民救済(275)。
14. chilloutmix / HardcoreHentai (74)
15. ModelSamplingAuraFlow (91)
16. MMUAUDIO / nsfwmix (93)
- 今更使用で良い。学習でモデル作れる?アニメ声NSFW狙い(nsfwmixあり)。
17. Chroma2-Kaleidoscope / klein4b_turbo_r128 (LoRA) (94)
- Flux Klein 4b + LoRA0.8使用。奇形/指グチャ率高、エロ描写避け学習進むように見える。
18. LTX2 (240)
- 鳩村曲リップシンクでアメリカ人顔/表情大袈裟(アジア人学習不足?)。LoRAで直せず苦戦。
- InfiniteTalk + Wan2.1比リップ甘いが顔良い。
19. SVI / PainterLongVideo (259, 265, 305)
- i2v中出し余韻で6秒腰振りすぎ、3秒繋ぎ?(259)。
- 途中でモデル変え可能(Low固定+High切り替えで激しさ調整、余韻は素Wan推奨)(265)。
- PainterLongVideoはSVIよりつなぎ目ピストン遅く、余韻ぴくぴく良い(305)。
20. susamix v3 / vpred1 (285)
- 試すが変な画像しか出ず(RTX3080 12GB, A1111 v1.10.1)。Illustlious/pony系はOK。
- normオプション? A1111非対応(reforge推奨)、devブランチなら対応(287,288,292)。
21. anikawa (285)
- susamix v3/vpred1で問題なく出力。
22. zbase (291, 296)
- kohakuくらい性能? 最初モデル過剰期待され大変。
23. Lumina (274)
- ZIB比エロチューン来てるが元性能段違い(ZIB優位)。
24. Zpony (282)
- PONYの次世代新モデル、オープン公開偉い(性能悲惨で誰も触らず手のひら返し)。
25. wai (284)
まとめ的洞察:
- Z-image/ZIB系が最多話題。将来的SDXL後継候補として期待大(クリエイティブ性、LoRA親和性、ライセンス良し)が、エロチューン/ファインチューン待ち状態。
- 懐かしモデル(waifuDiffusion, chilloutmix等)多め。
- 動画/音声モデル(PainterAI2V, LTX2, HeartMula, grok video等)の問題解決/比較議論活発。
- 全体的にローカル環境の互換性/VRAM/学習効率が焦点。