抽出された生成AIモデルに関する話題
ログ全体から、指定されたモデル(NovelAI (NAI), Pony, illustrious(イラストリアス, リアス,ill,IL), Noobai, FLUX, Wan, Qwen)に関する言及をすべて抽出。NovelAI (NAI) と Pony に関する言及はなし。各モデルの話題をレス番号順にまとめ、特に選ばれている理由や評価点(肯定的・否定的含む)を明記。
illustrious (イラストリアス, リアス, ill, IL)
- 457: IL1.0以降のオタ系ベースモデル(IL含む)は、自然言語とdanbooruタグを同時に自然に入力可能。Noob/Newbie/Luminaなども同様。
- 理由/評価: オタク向け(オタ系)ベースとして自然言語+danbooruタグ対応が強み。
- 537: リアス(illustrious)でもdanbooruタグ以外(例: “vaginal opening is distorted”)が効き、おまんこの入口が自然に歪む。
- 理由/評価: danbooruタグ以外も効く柔軟性が高く、AIらしい均整の取れた描写を自然に調整可能。
- 539: リアスで”erect nipples”などもシード固定で効く(danbooruにないタグ)。
- 理由/評価: 537の続きで、タグの柔軟性を再確認。
Noobai (Noob, noob1.0)
- 457: NoobもIL1.0以降同様、自然言語とdanbooruタグ同時入力可能(オタ系ベース)。
- 理由/評価: オタク向けベースモデルの一つとしてタグ対応が強み。
- 578: noob1.0が出て以来、数ヶ月ぶりにローカル再開したが、静止画の主流は何?
- 580: イラストは未だにnoob(主流)。
- 理由/評価: イラスト生成の主流モデルとして継続的に使われている。
FLUX (Flux2 klein, flux 2.0 klein, flux2 klein 4B)
- 573: Flux2 kleinは編集でそれなりに良さげ、早いからガチャ打ちしやすい。
- 理由/評価: 編集性能良く、生成速度が速いためガチャ(高速試行)向き。
- 579: flux2 klein 4Bは生成早いが指が6本になる。今時のモデルでこれはなし、9Bはライセンス的にありえん。
- 理由/評価: 生成速度速いが品質(指の異常)が悪い。ライセンス問題で高性能版避けられる。
- 580: 次世代モデルとしてflux 2.0 kleinが性能・軽さで有力視。ただし出たばかりで学習環境未整。
- 理由/評価: 性能・軽量さが有力だが、LoRA学習環境が整っていないため普及遅れ。
Wan (wan, Wan2.2, Wan S2V, wan2.2 i2v など)
- 434: WanVideoWrapperとKJNodesに入ってる?
- 444: WanのS2V(SoundToVideo)が音声ファイルから動画生成。ただしエロ無理、アニメ未チューニングで使い道難しい。リップシンク特化は実写/3Dアニメ向き。Sora2の日本アニメ性能が異常。
- 理由/評価: 音声→動画生成に特化だが、エロ不可・アニメ未対応でここ(なんJ?)向きでない。
- 448: wanで騎乗位シーン(女が男に座る)作りたいが腰振ってしまう。”sittingsitting”で試す。
- 495: Wan2.2のi2vは激しい動き無理。プロンプト入れても首動かすだけ。
- 496: Wan2.2 i2vの動き制限は高速化(低ステップ)の犠牲。BF16高速化なしが本来性能だが5090でも力不足。三段サンプラー有効かもだが生成時間長く万能でない。
- 理由/評価: 高速化優先で動きの複雑さが犠牲。高速生成向きだが本領発揮に高スペック/GPU必要。
- 505: easyWan22すら触らず相談増。LoRA使わずWan2.2で「エロ出ない」と言うレベル。
- 530: wanやLTXはサンプラーで変わるか疑問(変わったような変わらん)。
- 565: LTX-2/wan/旧Forgeをembedded Pythonで直指定。
- 580: 動画はwan2.2(主流)。次世代はltx-2有力だがwan2.2が現主流。
Qwen (qwen, qwen image, qwenedit)
- 440: qwenが動かないからqweneditに画像ぶち込んで内容無視で英語生成。元画像修正できない。
- 理由/評価: 動かない代替としてqwenedit使用(英語生成に特化?)。
- 580: リアル系はqwen image(重い)。
- 理由/評価: リアル系画像生成に使われるが重いのが欠点。
まとめ
- 抽出総数: IL/リアス(3箇所)、Noobai(3箇所)、FLUX(3箇所)、Wan(10箇所超)、Qwen(2箇所)。NAI/Ponyなし。
- 傾向: Wan/Noobaiは動画/イラスト主流として頻出。ILはタグ柔軟性、FLUXは速度/軽量さ、Qwenはリアル/代替用途。理由は主に性能(速度・柔軟性・特化)、欠点(エロ不可・重さ・品質問題)、環境(学習未整・GPU依存)。
抽出された生成AIモデルに関する話題
ログ全体から、除外リスト(NovelAI, Pony, illustrious/イラストリアス/リアス/ill/IL, Noobai, FLUX, Wan, Qwen)に該当しない生成AI「モデル」(主に画像/動画/TTS/音楽生成モデル)に関する言及を抽出。ツール/ノード/データセット(例: KJNodes, SVI, Llasa-Captions, Japanese-Eroge-Voice-V2)は除外。モデルが選ばれている理由(性能、用途、利点など)が明記されているものを優先的にまとめ、各モデルの文脈を簡潔に記述。
1. smoothmix, dashiwa, enhancedNSFW (432)
- エロ画像生成に特化したマージモデル/追加学習モデルとして紹介。
- 理由: エロコンテンツを出力可能。LoRAを使い個別に強度調整できるため好まれる(»432でエロ向け推奨)。
2. T5Gemma-TTS-2b-2b / T5Gemma-TTS (445, 556)
- TTS(テキスト-to-スピーチ)モデル。
- 理由: 抑揚調整なしで自然な発声が可能(»556)。挑戦中だがインストール時のトラブル報告あり(»445)。
3. YuE, ACE-Step (442-447, 459, 470, 487, 494)
- Sunoのローカル代替音楽生成モデル。
- 理由:
- 流行らずレベルがSuno/Udioに劣る、日本語対応弱いため需要薄(»447)。
- ComfyUIで使用可能、楽曲生成(音質は悪いが作れる)、reference音声設定で声変更可能→ローカルメリット大(»459, 470)。
- UVR5+RVC併用で歌声変更推奨、作り放題が最大利点(»487)。
- 音質は2世代前Suno並みだが、曲想得る用途で使える(»494)。
4. ZIT (491, 547)
- LoRAモデル(ZIT LoRA新作)。
- 理由: FP4量子化+sage-attentionで1.2秒/generationの高速生成(赤玉確率向上、»547)。ただし新作でDL0現象(バグ?)発生(»491)。
5. LTX-2 / LTX2 (444?, 474, 580, 613, 630)
- 次世代動画生成モデル。
- 理由: 性能と軽さで有力視(»580)。32GBメモリでスワップなし生成可能、メモリ管理優秀(»613)。音声ファイルLatent入力で謎言語出力(期待外れ、»572)。公式テンプレのサブグラフ動作不良報告(»630)。
6. Z-Image / Z-Image Base / Z-Image-Turbo (580, 584, 591, 595)
- 次世代画像生成モデル(静止画主流候補)。
- 理由:
- 出たばかりで学習環境整わず品質悪いが、二次イラスト特化余地あり(Z-Image Base状態、»580, 584)。
- Turbo版は蒸留後強化学習で高品質化狙いだが難航中(»591)。指6本問題多発の可能性(»595)。
追加ノート
- Suno (431, 442, 447, 455, 487, 603): 音楽生成サービス(V5でエロ/可愛い声両立)。ローカル代替需要あるがクラウド格安でローカルメリット薄(»447)。モデル本体言及少なくサービス寄りで抽出微妙だが、声質/歌詞対応で話題。
- これ以外で明確なモデル言及なし(例: SVI/PLVはノードツール、Flux2 klein/ZIT FP4は除外対象含む)。
- 全体傾向: エロ/動画/TTS/音楽でローカル需要高く、軽量・高速・カスタム(LoRA/reference)理由で選好。次世代モデル(LTX-2, Z-Image)は性能/軽量有望だが学習環境未熟。