生成AIモデルに関するレポート:ログ抽出分析
流行モデルの推測とまとめ(冒頭)
ログ全体(複数抽出結果統合、約4〜1000レス)を分析した結果、Wan(特にWan 2.2), Qwen(QI25I2/QIE2512系), FLUX(Flux.2-klein 4B/9B), illustrious(リアス/ill系)が最多言及で最も流行。これらはComfyUI環境でのローカル画像/動画生成(特にエロ描写、t2v/i2v)で活発に議論され、選好理由は「速度向上(NVFP4/ドライバ更新/量子化)」「プロンプト準拠性・自由度」「VRAM/低スペック耐性」「動画一貫性・時短」が共通。Wanは動画定番(シーン遷移安定)、Qwenは高速LoRA/リアル系、FLUXは軽量edit/速度、illustriousはアニメキャラクター表現で支持。次点でZIT/Z-Image(高速低スペック), LTX-2(動画最高峰), SDXL(エロ静止画定番)が注目。新鋭モデル(GLM-Image, Grok)はVRAM高要求やクラウド不安定さが課題だが、文字生成/リアリティで期待。NovelAI/Pony/Noobaiは言及少なく非主流。
各モデルの詳細分析(言及統合・選定理由強調)
抽出をモデルごとに統合し、重複除去。選ばれている理由(明示/示唆)を太字で強調。文脈は主にComfyUI/Forgeでの画像/動画生成(エロ/実写/アニメ)。
Wan (Wan 2.2, EasyWan22)
- 言及頻度: 最高(30,91,98,107,108,117,153,186,193,195,255,265,346,354,373,440-462,500-502,506,536-539,564,567,569,606-607,654,660,872,890,894,922,923,943,947,962)。
- 主な特徴/理由:
- 動画生成定番(口パク/リップシンク、t2v/i2v、5秒短尺連鎖で長尺安定、シーン遷移自然)。MultiGPU不要で安定、NVFP4版でFP8比25%高速。
- ComfyUIポータブル/テンプレ入りで初心者向け(177秒/640x640)。Motion scaleでマーライオン(口液体破綻)抑制。
- 課題: VRAM食い(80GB超)、CFG=1推奨(ネガ効き弱)、エロ副作用(液体噴出/チンポ化)。
- 流行要因: 実用的動画環境のエントリー、抜きガチャ/雑犯し遊びに最適。
Qwen (Qwen Image, QI25I2/QI2512/QIE2509/2512)
- 言及頻度: 高(72,78,107,140,153,179,187,201,220,234,256,288,298,311,323,334,354,382,419,425,442,452,462,568,570,576-579,584,587,626,634,714,720,743,872,873,878,906,947,967)。
- 主な特徴/理由:
- 背景/人物配置自由度高(詳細プロンプト/小説コピペ通る)、高速化LoRAで画質維持(4stepでZIT超え、ドライバ更新17%速/11.3秒)、Prompt反応良好、Z-Image対応。
- 動画時短(スクショ再構築→Wan連結、表情/髪安定)。実写系顔多様性(有名人名指定)。専用LoRAローダーあり。
- 組み合わせ最強(illustrious+QIでキャラ/背景強化)。VRAM中間(FLUX.2以下)。
- 課題: SageAttention黒画面、fp8問題、ランダム性低(同一顔)、エロ非対応警告、表現過剰。
- 流行要因: 量子化耐性/速度で最強候補、リアル/アニメLoRA併用。
FLUX (Flux.2-klein 4B/9Bなど)
- 言及頻度: 高(78,140,201,237,591,593,596-597,599,601,602,636,711,713,720,731,736,739,740,743,744,748,872,873,878,964,987,996)。
- 主な特徴/理由:
- 生成速度抜群(4080Sで4B:2.1秒/9B:5.9秒、cfg1 steps4)、軽量edit可能(16GBターゲット)、ベンチ良/普段使い最適、ベース公開で拡張性高。
- 実写写真ぽさ/フォトリアル乳首出力。繰り返しプロンプトで裸エプロン等制御。
- 課題: 手足変形/背景引きずり、日本語/アニメ弱、エロ徹底排除(検閲強、SD3二の舞懸念)、LoRA作成CUDA Toolkit必須。
- 流行要因: 小型高性能でハイエンド不要、z-image対抗。
illustrious (リアス/ill/IL)
- 言及頻度: 中高(193,195,230,310,321,323,459,488,495,580,590,764,773,787,911)。
- 主な特徴/理由:
- キャラクター表現力最強(QI/QIE組み合わせで最強)、目の形制御(tsurime/tareme効く)、低スペック耐性(RTX5050 8GB/モバイルノートOK)、リアル肌LoRA併用。
- アニメ/SDXLエロ静止画主力(虹エロ定番、SDXL進歩停滞で継続)。
- 課題: nunchaku無力、胴長問題(解像度依存)、低メモリSSD削り。
- 流行要因: Pony古モデル超えの精度、低スペックエロ生成。
ZIT / Z-Image / Z-Image-Turbo / ZIbase
- 言及頻度: 中(40,42,59,72,107,153,257,284,288,306,484,570,576,577,586,590,602,641,763,765,766,767,769,770,771,775,777)。
- 主な特徴/理由:
- 低スペック高速(3060/16GBで30秒、steps8で1it/s、turbo VRAM2GB、ドライバ更新高速化)。ネガプロ対応(ZIbase)。
- 将来性高(二次モデル期待)。
- 課題: 3本足率高、指6本、NSFW弱(中国規制)、LoRA質低。
- 流行要因: メモリ不足対応/量子化豊富。
LTX-2 / LTX2
- 言及頻度: 中(97,104,106,112,114,116,133,136,183,236,254-255,265-268,276,283,286,302,309,443,521,621,627,637,643,708)。
- 主な特徴/理由:
- 動画最高峰(1分楽勝、後付音声爆速、実写有利、NVFP4精度上)。RAMオフロード自動。
- 音声プロンプト/アニメ声再現。
- 課題: 不安定(Python落ち/エラー多)、i2v被写体動かず、アニメ/エロ弱。
- 流行要因: cu130/RTX50XX恩恵大。
SDXL
- 言及頻度: 中(72,73,78,573,577,586,590,718)。
- 主な特徴/理由:
- エロ静止画/実写定番(FaceDetailerで清書/劣化回避、表現幅広、LoRA互換高)。
- 課題: 配置指示弱、進歩停滞。
- 流行要因: ガチエロ安定。
その他注目モデル
- Grok: エロ動画リアリティ最高(速度早、ズレ動き狙い)だがクラウド不安定/検閲。
- GLM-Image/GLM4: 文字生成最強(漫画/プレゼン)、ハイブリッド先進的。VRAM80GB+課題。
- NovelAI (NAI): メタデータ抽出/女オンリー定番(少数)。
- Pony: 古モデル非推奨(タグ無効)。
- Noobai: LoRA学習期待以下(少数)。
全体洞察と傾向
- 選好パターン: ローカル最適化(SageAttention/nvfp4/ドライバ)が鍵。エロ生成(副作用多)でWan/Qwen/illustrious活発。動画>静止画。新規は速度/VRAM効率重視。
- 課題共通: エロ規制/検閲、不安定(黒画面/破綻)、中国モデルNSFW弱。
- 将来性: ZIT/LTX-2/GLMの軽量化/NSFW進化期待。ログは技術コミュニティ(ComfyUI中心)で、ハイエンドGPU(RTX40/50XX)前提。
追加質問があれば詳細抽出可能。