生成AIモデルに関するレポート
流行モデル推測のまとめ
提供テキスト(複数のログ抽出結果)から、生成AIモデルの話題を分析した結果、LTX-2、HeartMuLa (HeartMula)、Wan (主にWan2.2)、Qwen (主にQwen3系/2512/TTS)、illustrious (リアス/ill/IL) が最も頻出・活発に議論されており、流行の中心と推測されます。
- LTX-2: 動画生成(特にエロ/I2V/音声同期)の最多言及モデル。低スペック対応とNSFW適性でローカルユーザー中心に支持。
- HeartMuLa: 音楽生成の新星。低リソース(VRAM12GB前後)で高品質、日本語対応・商用ライセンス緩和が人気。
- Wan2.2: エロ動画/I2V生成の安定高品質で「最強」と評価。LoRA/SVI拡張性が高い。
- Qwen: 検閲解除版のNSFW対応、TTS/画像編集の最新性・日本語適性で多用途。
- illustrious (リアス): エロ画像生成で「優勢」との声多数。初期バージョンの人気継続。
これらはComfyUI環境前提のローカル生成(エロ/動画/音楽)が主文脈で、低スペック動作・NSFW適性・LoRA拡張・日本語対応 が共通の選好理由。Z-Image/Klein/Grokなども注目株だが、頻度で劣る。
各モデルの詳細レポート
以下に、テキストから抽出された主なモデルを分類し、話題概要と選ばれている主な理由(明記されたものを優先)をまとめます。除外モデル(NovelAI, Ponyなど未言及のものは省略)。
1. LTX-2 (動画生成モデル、エロ/音声同期中心)
- 話題概要: 最多言及(全ログで58-230, 244-432, 456-616, 731-838など)。ComfyUI互換WF、低スペック版(VRAM12GB/RAM32-64GB)、エロLoRA/音付け(喘ぎ声後付け)、I2V/V2V/リップシンク、fp8軽量化、専用VAE Loader。課題:不安定(SageAttention/Triton)、RAM128GB推奨、二次元溶けやすいがアニメLoRAで改善。
- 選ばれている主な理由:
- 低スペック対応: VRAM12GBで30秒動画生成可能(60,96,106,229,227)。
- NSFW/エロ適性: エロLoRAマージで自然動作(自動腰振り、Improved Female Nudity LoRA)、音声同期最強(152,145,200,244,245)。
- 多機能/将来性: Audio2V2V、LoRA/ファインチューン拡張(104,124,283,350,512)、ComfyUI公式テンプレあり(366)。
- 代替優位: Wan代替の音声後付け(151,200)、エロ動画最適解(244)。
2. HeartMuLa (HeartMula/ハートムラ、音楽生成モデル、3Bパラメータ)
- 話題概要: 高頻度(178-224, 239-352, 454-542, 819, 873-975)。ComfyUIノード(Benji/FL-heartmula)、VRAM12GB/RAM32GB動作、日本語/エロソング、Extend機能、Suno v3.5並。改良版/7B期待、ライセンスApache-2.0へ変更。
- 選ばれている主な理由:
- 低リソース高品質: VRAM12GB/3060で高速(178,187,532)、3BでSuno超え(日本語制御、歌詞タグ[Verse 1][end]効き、224,266,274)。
- ローカル自由度/商用OK: エロソング無制限、日本語対応(漢字修正で改善、178-182)、ライセンス緩和でGUI/LoRA歌手指定爆発予測(339,352,398)。
- 統合性: Z-Image-Turbo静止画+LTX動画組み合わせ(224)、インスト/アニソン得意(525,538)。
3. Wan (主にWan2.2/EasyWan22、動画/I2Vモデル)
- 話題概要: 高頻度(151-229, 253-399, 439-614, 645-802, 842-977)。エロI2V/音声同期、スローモーション問題(frame rate調整/プロンプトrapidly)、SVI/PLV LoRA(kijai版優位)、GGUF/4step高速化、InfiniteTalk派生、長時間生成(PainterLongVideo)。
- 選ばれている主な理由:
- エロ動画高品質/安定: 「強過ぎる」最強モデル(151)、エロLoRA相性抜群(Smoothmixでスローモ解消、262,276)、日本語プロンプト優位(654)。
- 拡張性/手軽さ: SVI LoRA(kijai版成功率高、377)、EasyWan22ポータブル(382,439)、GGUF+LoRAで1分5秒動画(842)。
- リアル系適性: 現在最強(614)、リップシンク/長動画(489,545)。
4. Qwen (主にQwen3-4B-abliterated/heretic-v2, QI2512/QIE/ZIB, TTS/スピーチ)
- 話題概要: 多用途(11-206, 254, 442-635, 879-908)。検閲解除版NSFWテキストエンコーダ、VLMプロンプト支援、画像編集(QwenImageEdit)、TTS(Qwen3-TTS、日本語訛り/エロ限界)、Flux2 Klein NSFW学習、FP8/GGUF量化トラブル。
- 選ばれている主な理由:
- NSFW/検閲解除: abliterated/hereticでエロ対応(48,73,136)、プロンプト追従性高(QI2512、52)。
- 最新性/多機能: 迅速更新(52)、TTS性能高(日本語対応、Apache2ライセンス、594-631)、一貫性維持(QIE、11,29)。
- ローカル実用: LMStudioキャプション(69,73)、GGUF Q8で高速回避(884,887)。
5. illustrious (イラストリアス/リアス/ill/IL、画像生成モデル)
- 話題概要: エロ画像中心(379,406,639-799)。XLベース、初期0.1/Noob1.0人気、v3.5-vpredオンライン限定、キャプション/データセット学習高コスト。
- 選ばれている主な理由:
- エロ生成優勢: 他モデル(Flux/Qwen)より優位、2次エロ知識豊富(650,799)、シコ用実用(787)。
- 初期人気: 0.1/Noob1.0で大いにぎわい(777)。
6. その他の注目モデル
- Z-Image / ZIE / Z-Image-Turbo / ZimageBase: 一貫性/編集/LoRA容易(29,30,224,442,649)。理由: SD並みエロ派生期待、静止画高速(将来性高)。
- Klein (klein-base/distilled): 軽量高速編集、LoRA互換(29,32)。理由: 実用性高。
- Gemma (gemma_3_12B_it): LTX-2テキストエンコーダ/キャプション、NSFW代替(62,69)。理由: fp8軽量、Qwen代替。
- SVI (Stable Video系LoRA/派生): Wan拡張(357,366,377)。理由: kijai版安定、高速NSFW。
- Grok: 高速動作/NSFW LoRA類似挙動(862)。理由: 音声/画像クオリティベンチマーク。
- その他マイナー (RVC, ace-step, InfiniteTalk, SAM3, T5Gemma, Sora2など): 音声/動画補助ツールとして散発。理由は手軽さ/ローカル流暢さ中心。
全体傾向と示唆
- 共通選好: ComfyUIローカル環境、低VRAM/RAM動作、NSFW/エロ拡張(LoRA必須)、日本語対応、商用ライセンス。課題は不安定(SageAttention/量化)、ハイエンドGPU(5090+)推奨。
- 進化速度: 月単位で新版/LoRA/ライセンス変更(HeartMuLa 3B→7B、ZimageBase待ち)。
- 用途別流行: 動画(LTX-2/Wan)、音楽(HeartMuLa)、画像エロ(リアス)、TTS/編集(Qwen)。
このレポートはテキストの全抽出を基に要約。追加分析が必要ならお知らせください。