なんJ(5ch)掲示板会話ログレポート
概要
このログは、AI画像/動画生成ツール(主にStable Diffusion関連)を扱うスレッドの抜粋です。参加者はローカル環境での画像生成、動画生成、LoRA学習、ComfyUIのカスタムノード導入、TensorRTの高速化、音声付与(MMAudio)などの技術を議論しています。主なツールとしてWan、Qwen、Smoothmix、Grok、ComfyUIが登場し、エロティックなコンテンツ生成(NSFW)が中心ですが、技術的なトラブルシューティングやTips共有が活発です。全体的に、初心者から上級者までの知見交換が見られ、規制や倫理的側面(例: 声優の無断学習)も触れられています。ログは435から635までのレスで、ComfyUIの導入苦戦や新ツールの検証が目立ちます。
主要な議論点
1. 画像/動画生成ツールのTipsとトラブルシューティング
- SmoothmixとWanの使用法:
- 435-437: Smoothmixで初期画像の画風を保持したい場合、シフト値を上げる(例: 作者WFの8から調整)。シフト値が高いと初期画像保持しやすくなるが、動きが弱まりプロンプト追従性が低下。EasyWan22の標準シフト値は5で暴れやすい。
- 482: MMDで4面リファレンス画像を作成し、SmoothmixWan2.2で動画生成。終了時のフェードが惜しいが、プロンプトで調整試行中。
- 508: Smoothmixで手ブレ効果を入れる方法を質問。
- 589: Wan2.2の「Wan画像からビデオへ」ノードでClipビジョン出力は使われていない(Wan2.1では使用)。接続の有無で生成結果が変わらない。
- 591: Wan2.2で動画の一部にモザイクをかける方法を質問(専用ノードやフリーソフトの使用法を求める)。
- TensorRTの導入と問題:
- 452, 473, 487: イラストのアプスケでTensorRT使用時、一辺1280超でエラー。Clean VRAMで2秒かかるが実用性低い。ソース弄りでサイズ調整可能。
- 557, 567-572, 600-610: TensorRT導入の苦戦報告(例: 黒画像生成、エラー)。Upscale用とフレーム補完用(Rife TensorRT)の区別を指摘。モデル変換時のサイズ設定(最小512/最大2048)で黒画像発生。ComfyUI-TensorRTとWebUI版の違いを議論。解決策としてログをAI(ChatGPTなど)に投げて分析。
- 617-619: TensorRTは動画向けが主だが画像にも使える。ただしLoRA非対応で更新停止。
- ComfyUIの導入とカスタムノード:
- 507, 526-529: ComfyUIは初心者向けで、基本WFは30分で組める。Forgeから移行すると習熟遅れる。元々開発者向けUI。
- 581, 584, 593, 614, 629: 導入時の怪現象(フォルダ消失、gitブランチ切り替え問題)。MMAudioのプルリク適用でComfyUI本体が影響。解決法: .git確認後、フォルダ削除してGitHubから再インストール。
- 635: reForgeからComfyUI移行時のアップスケーラー質問。UltimateSDUpscale+4x-Animesharpでグチャ模様発生。デノイズ0.125でも顔は良いが調整必要。
2. LoRA学習とモデル検証
- LoRA作成のTips:
- 455, 457, 459-461, 465, 470-478, 491-493: 動画LoRA学習はVRAM12GBでは厳しく、4090で半日(high/lowのみ)。Qwen2509でLoRA作成可能(メインRAM逃がし機能でVRAM12GB対応)。姫騎士ニキの提供LoRAに感謝の声。触手LoRAはアナル特化で前向き不明。
- 477, 495: Qwen Image EditでLoRA作成推奨(使用頻度高い)。bf16モデルで512解像度、1000ステップの条件下でVRAM12-24GBの所要時間報告(スワップ使用で6時間超)。
- 492: Qwen LoRA作成で暖房代わりになるレベル。
- 新モデル検証:
- 454: ChronoEdit(ComfyUI公式テンプレ)。Wan VAE使用で時間移動編集。一貫性優れるが解像度問題(VRAM16GBで1024長辺実用外)。Qwen Image Editの方が実用的。
- 469: BindWeave(Wan2.1ベース)。複数キャラ動画に良さげ。
- 522, 538, 613: NetayumeLumina検証。タグオンリーで戦えるが自然言語+タグでチープ感増。複数キャラ位置関係は優秀だが拳銃描写弱く、SDXL移行先としては不十分。
- 549: Wan2.2のlightx2v一体型と4steps-LoRA検証。Sekoの効果不明。
3. 音声生成と付与
- MMAudioの使用:
- 494, 503, 517-519, 543, 558-560, 563, 566, 571, 585: NSFW音声付与実用的。pow powでパンパン音生成。fps16で同期問題(Rifで32fps推奨)。導入WF参考(AudioPitchMonoはImpact-Pack)。通常版で効果音(鳥/馬)可能だがNSFW版はチュパ音化。
- 497, 499, 502: MMAudio vs Comfy-MMAudioの違い。Comfy版導入推奨。
- 他の音声ツール:
- 440-442, 453, 525-530: にじボイス問題(無断学習疑い、声優酷似)。DMM子会社で炎上予想。「膣」を「なか」と読むエロゲ学習痕。
- 559-561, 564-565, 576: Anime-Speech-Japanese-Refiner(70GBモデル)。llasa-3b-captionsで詳細キャプション生成。LoRA作成可能か不明。
- 594, 598-599: Takane(イラン開発)。NSFW音声自然でストリーミング対応希望。Sora2より優位。
4. Grokと他のAIツール
- Grokの活用:
- 438-439, 445, 456, 504-506, 515, 521, 539, 544-546, 550-552, 556, 562: 日本語/英語プロンプトで画風変化(日本語: アニメ風、英語: バタ臭)。絵師タグ効かず。アップデートでモデレート強化/緩和の混乱。プロンプト生成依頼で打率向上。ロリ/中出し可能だが規制あり。
- その他ツール:
- 446, 468: Affinity(無料オブジェクト選択優秀、ラマクリーナー代替)。Qwen2509/ラマクリーナー/transparent-background必須。
- 466: Qwen2509で3枚画像投入で再現性向上。ControlNetで精度アップ。
- 633: VideoSwarmで短尺NSFW動画相性良。
5. 規制/倫理/その他雑談
- 430, 440-443, 453, 479, 525-531: 声優無断学習問題(にじボイス、Anneli)。日俳連の反応。AI学習合法だがお気持ちギルティ。
- 444, 447: コミケの意義(憧れ/接触/金稼ぎ/オフパコ)。
- 448, 450, 462, 464, 480, 488: SSD/メモリ値上げ議論。Fikwotセール情報。
- 449: 中国のAI優位性(表現の自由以外で日本劣勢)。
- 484-485, 489: 中国のエロ規制と海賊版放置。
- 500, 511: AIの武器描写弱点(M4カービン等一部OK)。
- 555, 575: XのAI関連ポスト非表示で狸/犬ポスト増加。
- 596-597: リアルモデルで生々しさ向上。
- 621: ワンド挿入プロンプト難。
結論とトレンド
このスレッドは、ComfyUI/TensorRTの導入ハードルが高く、黒画像やVRAM不足のトラブルが頻発する一方で、共有WFやTipsで解決が進む様子が見られます。動画生成(Wan/Smoothmix)と音声付与(MMAudio)の実用化が進み、NSFWコンテンツのクオリティ向上を目指す議論が中心。自然言語モデル(NetayumeLumina/Grok)の検証が増え、タグ vs 自然言語の優位性が争点に。一方、声優学習の倫理問題や中国AIの台頭が懸念されています。全体として、技術進化の速さに追いつけないユーザー(510, 602)の声が多く、ComfyUIのような柔軟ツールへの移行が推奨されるトレンドです。将来的に、VRAM効率化や規制対応が鍵となりそうです。