なんJ(5ch) AI関連スレッド 投稿ログ(637-836) レポート
このレポートは、提供された掲示板ログ(637から836までの投稿)を基に、議論の主要トピックをまとめ、キーとなるポイントを抽出・整理したものです。スレッドの全体像は、AIツール(主にComfyUI、動画/音声生成AI、LoRA学習)の技術共有、トラブルシューティング、ハードウェア要件、雑談が中心。参加者は主に経験者で、ワークフロー共有やエラー解決が活発です。ログは日本語のネットスラングが多く、ユーモアや自虐的なトーンが目立ちます。以下にトピックごとに要約します。
1. 動画生成AIの設定・最適化 (主な投稿: 637, 644, 646, 648, 653, 657, 660, 666, 668, 675-682, 685-688, 691, 694, 696, 698-699, 706, 709, 711, 730, 743, 756, 771, 809)
- 主要ツール: SmoothMix, Wanvideo, TensorRT, RIFE, Upscaler-TensorRT, holocine。
- 議論のポイント:
- TensorRT導入後のFPS調整(例: 60fps設定で高速化問題、Multiplier以外にフレーム補完の倍率連動でフレームレート自動入力)。
- VRAM/RAM使用の最適化: OOM(Out of Memory)回避のため、BlockswapやMultiGPU活用。NVIDIA設定の「システムフォールバックポリシー」を「なしに優先」に変更推奨。12GB VRAMでは厳しく、16GB以上が推奨(例: 4060Ti 16GBで5秒動画生成に220秒)。
- ワークフロー共有: »666で動画長さ秒数指定やフレーム補完の変更を共有。»668で16の倍数(例:64)対応。
- ハードウェア要件: holocineは57GBモデルでハードル高め。5090グラボの価格高騰(5万円上昇)や4070Ti/5070Tiの性能比較(例: 4070Tiで5秒動画4分半)。
- パフォーマンス: SmoothMixで120秒生成(5070Ti+128GB RAM)。アプスケ(アップスケール)有無で時間差大。
- トラブル: TensorRTのバージョン適合(環境次第でエラー、PyTorch/CUDA依存)。インストール順序(フレーム補完→アプスケ推奨)で回避可能。
- 全体感: 低スペック勢の苦労が多く、グラボ買い替え推奨の声。長尺動画(1920x1080 20秒)にはVRAM64GB+RAM512GB必要との推測。
2. 音声生成AIの導入・活用 (主な投稿: 662, 709, 711, 713, 715, 718-725, 728-729, 731-740, 742, 745, 748, 750-752, 754-755, 761, 764, 775-776, 781, 784, 797, 799, 804-806, 811, 814, 817)
- 主要ツール: Anime-Llasa-3B-Captions, EasyLlasa, SBV2, Whisper(キャプション生成)。
- 議論のポイント:
- 導入: »683でフォークリポジトリ共有(パッチ形式で簡単)。–whisper-cpu/–full-cpuオプション追加でCPU対応(例: Ryzen 5600Gで70-150秒生成)。
- 参照音声: VRAM12GBでOOM頻発(Whisperが原因)。解決策としてWhisperをCPU実行や事前キャプション入力(»723, »745, »764)。参照有りでガチャ要素強く、似せにくい(例: エロ音声入力で棒読み化)。
- 喘ぎ声生成: 濁点多めプロンプト(「おほぉ!んほぉ!」)で汚い喘ぎ声可能(»735, »748: ゾンビ風や熟女系)。EasyLlasaの方が参照精度高く、自然さでAnime-Llasa優位。ガチャ必須でセリフ抜け/破綻あり。
- 比較: Anime-Llasaは自然だがブレ大、EasyLlasaは参照似せやすい。合体希望の声。Adobe Auditionでピッチ調整推奨(»784)。
- 用途: エロ音声(喘ぎ声、うめき声)中心。英語喘ぎ(Oh yeah)が出やすいが、アニメ声トレーニングのため英語苦手説。
- トラブル: VRAM溢れ(12GBで10分超)、Whisperの遅延。キャプション事前準備で時短。
- 全体感: 進化を評価しつつ、リアルタイム/自動音声付与の要望。AIが声優/ナレーターを脅かす議論(»773, »778-779: イベント司会は安泰)。
3. LoRA学習とツール (主な投稿: 645, 651, 655, 663-664, 692, 786, 789, 792-796, 801, 816, 819)
- 主要ツール: LoRA_Easy_Training_Scripts, Redrayz GUI, Anime-Llasa-3B-Captions-Demo。
- 議論のポイント:
- オプティマイザ: AdamW8, Came, Prodigy, Lion, RadamScheduleFreeなど。学習ソース次第で差大(例: 80枚ソースで10エポック)。
- 公開: 怖くて公開せず(»651)。効果: 彩度低下、フラット化、目形逸脱。
- インストールトラブル: venv内の古いPipでエラー(typing-extensions不一致)。–upgrade-depsオプション提案(»789, »802-803)。Redrayz GUI推奨(コマンド生成でRexスケジューラ/full bf16対応可能)。
- 全体感: ノウハウ秘伝状態。自作勢が多く、ツールの使いやすさを重視。
4. その他のAIツールと画像生成 (主な投稿: 638-639, 640-643, 649, 650, 652, 658-659, 669, 697, 702, 707-708, 712, 726-727, 733, 747, 802, 809, 812, 820, 832-836)
- 主要ツール: Qwen-Image-Edit-Rapid-AIO, Grok, holocine。
- 議論のポイント:
- Qwen: ワークフロー目視コピー、横縞ノイズ問題(サンプラー/ステップ調整で緩和)。エロゲモザイク除去テスト(精度低いが意図伝達良好)。
- Grok: エロ画像緩め(おっぱい風船化、蹲踞OK)。コンテンツポリシー厳しめ。
- その他: holocine(長尺動画可能だが57GBモデル)。YESNO枕シチュ(»659)。チラリズム/ロリ巨乳生成(»707, »832-836: 3Dモデル推奨)。
- トラブル: Ctrl+↓↑プロンプト強度エラー(»650)。Civitaiイギリス遮断(»820)。
- 全体感: エロ/仮装テーマ多め。ComfyUIの接続視認性向上ツール(Quick Connections: »809)共有。
5. ハードウェア・雑談 (主な投稿: 646, 648, 654, 674, 677-678, 681, 691, 705, 714, 716, 754, 767-770, 788, 818, 821-831, 833-834)
- ハードウェア: 5090(36万購入例)、4070Ti(生成時間4分半)、低スペ苦労(70Ti待ち)。メモリ128GB推奨(96GB要注意)。電源/ネットワークトラブル共有(»705)。
- 雑談: AIの職業影響(声優/音楽: 打ち込み健在、プロデュース安泰»788, »818-831)。PonyV7イマイチ評価(»765-766)。方言ネタ(屁ふる»770)。
- 全体感: 高スペ自慢 vs 低スペ嘆き。AI進化の未来議論(音楽/エロのバーチャル化)。
全体の傾向と洞察
- 活発さ: 技術共有が多く、フォーク/パッチ(»671, »683, »753)で協力。エロ用途(喘ぎ声、モザイク除去)が目立つが、技術的深掘りがメイン。
- 課題: VRAM/RAM不足、バージョン依存、ガチャ要素。低スペ参加しにくく、浦島太郎感(»714, »766)。
- ポジティブ: 導入簡易化(フォーク感謝多し)。AIの進化(動画/音声)を楽しむ雰囲気。
- 注意: waiはIllustriousの派生モデルであり、wanvideoとは関係ありません(ログ内関連ツールに留意)。
このレポートはログのエッセンスを抽出したもので、詳細は原文参照を推奨。追加質問があれば уточいてください。