5chSummary

なんJ(5ch)掲示板会話ログレポート

概要

このログは、AI画像/動画生成ツール（主にStable Diffusion関連）を扱うスレッドの抜粋です。参加者はローカル環境での画像生成、動画生成、LoRA学習、ComfyUIのカスタムノード導入、TensorRTの高速化、音声付与（MMAudio）などの技術を議論しています。主なツールとしてWan、Qwen、Smoothmix、Grok、ComfyUIが登場し、エロティックなコンテンツ生成（NSFW）が中心ですが、技術的なトラブルシューティングやTips共有が活発です。全体的に、初心者から上級者までの知見交換が見られ、規制や倫理的側面（例: 声優の無断学習）も触れられています。ログは435から635までのレスで、ComfyUIの導入苦戦や新ツールの検証が目立ちます。

主要な議論点

1. 画像/動画生成ツールのTipsとトラブルシューティング

SmoothmixとWanの使用法:
- 435-437: Smoothmixで初期画像の画風を保持したい場合、シフト値を上げる（例: 作者WFの8から調整）。シフト値が高いと初期画像保持しやすくなるが、動きが弱まりプロンプト追従性が低下。EasyWan22の標準シフト値は5で暴れやすい。
- 482: MMDで4面リファレンス画像を作成し、SmoothmixWan2.2で動画生成。終了時のフェードが惜しいが、プロンプトで調整試行中。
- 508: Smoothmixで手ブレ効果を入れる方法を質問。
- 589: Wan2.2の「Wan画像からビデオへ」ノードでClipビジョン出力は使われていない（Wan2.1では使用）。接続の有無で生成結果が変わらない。
- 591: Wan2.2で動画の一部にモザイクをかける方法を質問（専用ノードやフリーソフトの使用法を求める）。
TensorRTの導入と問題:
- 452, 473, 487: イラストのアプスケでTensorRT使用時、一辺1280超でエラー。Clean VRAMで2秒かかるが実用性低い。ソース弄りでサイズ調整可能。
- 557, 567-572, 600-610: TensorRT導入の苦戦報告（例: 黒画像生成、エラー）。Upscale用とフレーム補完用（Rife TensorRT）の区別を指摘。モデル変換時のサイズ設定（最小512/最大2048）で黒画像発生。ComfyUI-TensorRTとWebUI版の違いを議論。解決策としてログをAI（ChatGPTなど）に投げて分析。
- 617-619: TensorRTは動画向けが主だが画像にも使える。ただしLoRA非対応で更新停止。
ComfyUIの導入とカスタムノード:
- 507, 526-529: ComfyUIは初心者向けで、基本WFは30分で組める。Forgeから移行すると習熟遅れる。元々開発者向けUI。
- 581, 584, 593, 614, 629: 導入時の怪現象（フォルダ消失、gitブランチ切り替え問題）。MMAudioのプルリク適用でComfyUI本体が影響。解決法: .git確認後、フォルダ削除してGitHubから再インストール。
- 635: reForgeからComfyUI移行時のアップスケーラー質問。UltimateSDUpscale+4x-Animesharpでグチャ模様発生。デノイズ0.125でも顔は良いが調整必要。

2. LoRA学習とモデル検証

LoRA作成のTips:
- 455, 457, 459-461, 465, 470-478, 491-493: 動画LoRA学習はVRAM12GBでは厳しく、4090で半日（high/lowのみ）。Qwen2509でLoRA作成可能（メインRAM逃がし機能でVRAM12GB対応）。姫騎士ニキの提供LoRAに感謝の声。触手LoRAはアナル特化で前向き不明。
- 477, 495: Qwen Image EditでLoRA作成推奨（使用頻度高い）。bf16モデルで512解像度、1000ステップの条件下でVRAM12-24GBの所要時間報告（スワップ使用で6時間超）。
- 492: Qwen LoRA作成で暖房代わりになるレベル。
新モデル検証:
- 454: ChronoEdit（ComfyUI公式テンプレ）。Wan VAE使用で時間移動編集。一貫性優れるが解像度問題（VRAM16GBで1024長辺実用外）。Qwen Image Editの方が実用的。
- 469: BindWeave（Wan2.1ベース）。複数キャラ動画に良さげ。
- 522, 538, 613: NetayumeLumina検証。タグオンリーで戦えるが自然言語+タグでチープ感増。複数キャラ位置関係は優秀だが拳銃描写弱く、SDXL移行先としては不十分。
- 549: Wan2.2のlightx2v一体型と4steps-LoRA検証。Sekoの効果不明。

3. 音声生成と付与

MMAudioの使用:
- 494, 503, 517-519, 543, 558-560, 563, 566, 571, 585: NSFW音声付与実用的。pow powでパンパン音生成。fps16で同期問題（Rifで32fps推奨）。導入WF参考（AudioPitchMonoはImpact-Pack）。通常版で効果音（鳥/馬）可能だがNSFW版はチュパ音化。
- 497, 499, 502: MMAudio vs Comfy-MMAudioの違い。Comfy版導入推奨。
他の音声ツール:
- 440-442, 453, 525-530: にじボイス問題（無断学習疑い、声優酷似）。DMM子会社で炎上予想。「膣」を「なか」と読むエロゲ学習痕。
- 559-561, 564-565, 576: Anime-Speech-Japanese-Refiner（70GBモデル）。llasa-3b-captionsで詳細キャプション生成。LoRA作成可能か不明。
- 594, 598-599: Takane（イラン開発）。NSFW音声自然でストリーミング対応希望。Sora2より優位。

4. Grokと他のAIツール

Grokの活用:
- 438-439, 445, 456, 504-506, 515, 521, 539, 544-546, 550-552, 556, 562: 日本語/英語プロンプトで画風変化（日本語: アニメ風、英語: バタ臭）。絵師タグ効かず。アップデートでモデレート強化/緩和の混乱。プロンプト生成依頼で打率向上。ロリ/中出し可能だが規制あり。
その他ツール:
- 446, 468: Affinity（無料オブジェクト選択優秀、ラマクリーナー代替）。Qwen2509/ラマクリーナー/transparent-background必須。
- 466: Qwen2509で3枚画像投入で再現性向上。ControlNetで精度アップ。
- 633: VideoSwarmで短尺NSFW動画相性良。

5. 規制/倫理/その他雑談

430, 440-443, 453, 479, 525-531: 声優無断学習問題（にじボイス、Anneli）。日俳連の反応。AI学習合法だがお気持ちギルティ。
444, 447: コミケの意義（憧れ/接触/金稼ぎ/オフパコ）。
448, 450, 462, 464, 480, 488: SSD/メモリ値上げ議論。Fikwotセール情報。
449: 中国のAI優位性（表現の自由以外で日本劣勢）。
484-485, 489: 中国のエロ規制と海賊版放置。
500, 511: AIの武器描写弱点（M4カービン等一部OK）。
555, 575: XのAI関連ポスト非表示で狸/犬ポスト増加。
596-597: リアルモデルで生々しさ向上。
621: ワンド挿入プロンプト難。

結論とトレンド

このスレッドは、ComfyUI/TensorRTの導入ハードルが高く、黒画像やVRAM不足のトラブルが頻発する一方で、共有WFやTipsで解決が進む様子が見られます。動画生成（Wan/Smoothmix）と音声付与（MMAudio）の実用化が進み、NSFWコンテンツのクオリティ向上を目指す議論が中心。自然言語モデル（NetayumeLumina/Grok）の検証が増え、タグ vs 自然言語の優位性が争点に。一方、声優学習の倫理問題や中国AIの台頭が懸念されています。全体として、技術進化の速さに追いつけないユーザー（510, 602）の声が多く、ComfyUIのような柔軟ツールへの移行が推奨されるトレンドです。将来的に、VRAM効率化や規制対応が鍵となりそうです。