生成AIモデルに関するレポート
冒頭まとめ: テキストから推測される流行モデル
提供された複数の5chログ抽出結果から、生成AIのモデルに関する議論は主にローカル環境(VRAM管理、ComfyUI対応、LoRA作成)やエロ/NSFW生成、動画生成に集中しています。これらの文脈で最も流行していると推測されるモデルは以下の通りです:
- Qwen(特にQwen Image Edit 2509やbf16/fp16版): ログ全体で圧倒的に言及数が多く、巨大モデルのVRAM最適化、画像編集(インペイント、二次→三次変換)、NSFWチューニング、LoRA作成の可能性が焦点。安定性と表現力の高さが評価されつつ、エロ学習不足や生成速度の課題が議論されており、将来のアップデート期待が高いため流行中。抽出件数は100件以上に及び、ComfyUIユーザーやスペック弱者からの支持が強い。
- Wan(特にWan 2.2やSmoothmixWan): 次点で多く、動画生成(タイムライン指定、エロシチュ)の安定性とLoRA対応が人気。VRAM不足時のDistorch2活用やプロンプト翻訳の工夫が頻出。抽出件数は30件以上で、エロ動画用途で選ばれやすいが、長時間生成の限界が指摘されている。
- Illustrious(イラストリアス, リアス, ill, IL): 言及は少ないが、ロボット学習(LoRA作成)やマージモデルとしてのコスパの良さ、マルチGPU環境での安定テストで注目。覇権期間の長さとLoRAの豊富さが理由で、移行ハードルが高いため一部で根強い人気。
- その他のモデル(NovelAI (NAI), Pony, Noobai, FLUX): 言及が少なく(またはなし)、流行度は低い。NovelAIはプロンプトテクニックの汎用性で一部評価、Ponyは歴史的言及のみ、Noobaiは更新停止の影響で代替探し、FLUXは実写表現の精度で新世代モデルとして期待されるが、全体的にQwen/Wanほど活発ではない。
全体として、QwenとWanがVRAM/安定性/エロ用途の議論で覇権を握っており、Illustriousはニッチな安定モデルとして流行。流行の背景は、ComfyUIの進化とローカルスペックの限界対応が大きいと推測されます。以下で各モデルごとに詳細をレポートします。
NovelAI (NAI)
ログでの言及は散発的で、主にプロンプトテクニックやトレーニング規模の比較に留まる。抽出された内容から、初心者向けの汎用性が高いモデルとして位置づけられている。
- 主な言及内容: NAIv3のプロンプトテクニックがWAI(Wan関連)で使える(304)。独自モデルをオープンソース化してほしい希望(293)。トレーニングがH100で23万時間かかり、コストが一億円級(335)。Vtuber衣装指定でタグベースのプロンプトが有効(703,705)。エロ生成の手軽さで最適解(626)。
- 選ばれている理由: プロンプトテクニックが覇権的で使いやすいため(304)。進化度が高く、ポン出しで綺麗な画像が出るため初心者やシンプル用途に充分(620,981)。画像参照機能の完成度が高く、自然日本語プロンプトと動画の進化を望む声あり(621)。手軽にエロ生成が可能で課金が最適解(626)。ローカル環境の複雑さを避けられるため、特殊用途以外で推奨(981)。
- 全体評価: 流行度は中程度。エロやドマイナーキャラ以外のスタートアップモデルとして安定した支持があるが、巨大トレーニングのコストが障壁。
Pony
言及は極めて少なく、歴史的または比較的な文脈のみ。流行度は低い。
- 主な言及内容: Pony時代からCivitaiにLoRAがアップロードされている(237)。WAIPonyXLでLoRAなしでも生成が安定(305)。リアス並みのマージモデルが必要(374)。
- 選ばれている理由: LoRAなしでも生成が基本的に問題なく、安定性が高い(305)。歴史的なLoRAの豊富さが背景にあるが、明示的な選定理由は少ない。
- 全体評価: 過去のモデルとして言及されるが、現在はリアスやQwenの影に隠れ、流行していない。マージモデルの必要性を指摘する声が目立つ。
Illustrious (イラストリアス, リアス, ill, IL)
ロボット学習やマージモデルとしての議論が中心。ログで1-2件の言及が多いが、コスパの良さが評価されている。
- 主な言及内容: ロボット(MS)の学習が可能か質問(229)。WebUIユーザーが移行できていない(282)。彩度低めのモデルとしてIllustrious-XL推奨(285)。新世代モデルがリアス+LoRAに勝てない(301)。ステップ数が少なくてもまともな絵が出る(304)。改良が進み移行ハードルが高い(382)。手指崩壊が辛い(392)。LoRA学習時のGPU使用率が安定(481)。リアス風LoRAを優先テスト(876)。simple background/sceneryの生成が良い(899)。クリエイティビティが優れる(920)。
- 選ばれている理由: LoRAの数が多く、覇権期間が長いため依存度が高く、ベースモデル単体で勝負しにくい(301)。ステップ数が少なくLoRAなしでもキャラ/スタイルが多いためコスパが高い(304)。改良が進んでいるため、次世代モデルへの移行ハードルが高い(382)。彩度低めのいい感じのモデルとして適している(285)。クリエイティビティが高く、Qwenの写実性と組み合わせ最強(920)。LoRA学習時の使用率が安定(481)。
- 全体評価: 流行度は中程度。マージモデルの必要性やコスパの良さが繰り返し議論され、安定したユーザー層があるが、エロや動画用途ではQwenに劣る。
Noobai
言及は少なく、更新停止の影響が大きい。代替モデル探しの文脈で登場。
- 主な言及内容: Illustriousの影響が大きい(383)。NSFWにやる気がないため置き換えにならない(878)。半年使用後、更新停止で代替を探す(741)。
- 選ばれている理由: 長期使用されており、安定性が高いが、更新停止のため代替(例: Illustrious)を試す(741)。NSFW置き換えの可能性が低い(878)。
- 全体評価: 流行度は低い。更新停止がネックで、過去のユーザーから代替探しの対象となっている。
FLUX
新世代モデルとして期待されるが、言及は少ない。実写表現の精度が焦点。
- 主な言及内容: 新世代モデルとしてリリースされたが、Illustriousに勝てない(301)。実写系の光/影表現で優位(303)。表現力とテキストエンコーダの性能が高い(330)。Flux2のリリースが楽しみ(373)。API/Playgroundで利用可能(377)。初心者向けAIお絵描きとして質問(448)。実写ロリの生成で衝撃的(906)。
- 選ばれている理由: 実写系の精度(光/影表現)が圧倒的に優れているため(303)。表現力とテキストエンコーダの性能が高いが、ポン出しが難しい(330)。実写ロリのクオリティが高く、Qwenより衝撃的(906)。
- 全体評価: 流行度は中程度。新世代としての期待が高いが、重さやイラスト系の限界が指摘され、Qwenほど議論されていない。
Wan (Wan 2.2, SmoothmixWanなど)
動画生成と安定性の議論が多く、抽出件数がQwenに次ぐ。VRAM最適化が鍵。
- 主な言及内容: プロンプト翻訳とニュアンス補完(71,75)。ComfyUI対応でVRAM不足時の安定(91)。動画生成の時間延長(128,139)。LoRAのカスタム生成(151,160)。MultiGPU環境でのテスト(187)。SmoothmixWanのワークフロー(234,369)。更新不要の安定版(314)。エロ動画生成の快適さ(460,463,465)。各種LoRA(516,517)。5秒学習モデルの限界(560,561,566,575,577)。Civitaiからの消失(847-860)。WAI-14がデファクトスタンダード(883)。WAN 2.2のワークフロー追加(929)。
- 選ばれている理由: 顔の安定性が高く、特定の絵柄で選ばれる(75)。ComfyUI対応でVRAM不足時の安定性が高い(91)。動画生成の時間延長に強いが、長時間に限界(128)。Distorch2との組み合わせで安定し、巨大モデル対応(139)。エロ用途でフル性能不要で低スペックで十分(460,463)。動きが良いが、エロプロンプトの工夫が必要(566,575)。5秒学習モデルだが、SmoothMix併用でプロンプト精度向上(561,577)。実質デファクトスタンダードで信頼性が高い(883)。アニメーションスタイルで動きが滑らか(929)。
- 全体評価: 流行度は高い。動画生成の安定性とLoRAの豊富さが強みだが、生成時間やプロンプトの英語依存が課題。エロ動画ユーザーから支持されている。
Qwen (Qwen Image Edit 2509, bf16/fp16版など)
ログの大部分を占め、巨大モデルの最適化、NSFW/LoRA作成が主な話題。抽出件数が最多。
- 主な言及内容: 16bit読み込みの困難とOOM対策(31,34,35,42,45,48,50,51,53,60,70,78,81,87,91,102,104,105,110,113,125,131,132,135,139,140,149,154,158,161,165,166,186,187,195,196,198)。動画準備の用途(51)。エロチューン待ち(149,277)。表現力の高さだがポン出し難しい(330)。エロ学習不足(332,333,334,365)。NSFWキャプション対応(391)。学習コストの高さ(403,445)。LoRA作成のテスト(435,440,446,447,457,458,468)。白黒写真着色(473)。二次→三次変換(663,666,670,707,727,730,731,745,752)。エロモデル待ち(524,636,791,969)。fp8/gguf版の問題(674,676,941,958)。二次専門モデル(874,878,883,884,889,892,893,897,904,906,909,920,922,923,924,943,964,967,968,993)。
- 選ばれている理由: bf16版が品質重視で最適、Q8版は速度重視(42,50)。ComfyUIの自動制御でVRAM不足時でも使える(45,81)。Distorch2で安定確実でストレスフリー(132,139)。LoRAの豊富さとエロチューニング期待(149)。公式Templatesで入手しやすく、Raw latent版でズーム回避(154)。Pixel単位指定で負荷一定、アス比柔軟(196,198)。エロ特化で細部/構図の性能が高いが、学習不足(333,892,904)。二次→三次変換の高精度(663,707,727,745)。NSFW対応で概念の多さと精度が高い(893,898)。巨大モデルでもメインメモリ逃がしで高速(923)。
- 全体評価: 流行度は最高。巨大さゆえのVRAM対策が議論の中心だが、画像編集/NSFWの可能性が高く評価。エロモデル待ちの声が多く、将来の覇権候補。