なんJ(5ch) AI生成スレッド ログレポート (投稿12〜226)
スレッド概要
- 対象ログ: 投稿12〜226(主にSDXL、ComfyUI、LoRA学習、動画生成(WanVideo/LTX-2/SVI)、音声合成(Style-Bert-VITS2/TTS)、AI漫画作成などの技術議論)。
- 全体傾向: AI画像/動画生成の高度なTips共有が中心。初心者トラブルシュート(エラー解消、ツールインストール)と上級者実験(位置制御、同一性維持)が混在。スレ無宣言建てが話題に上がりつつ、ここで進行。モチベ向上やPCスペック相談も。マネタイズ議論は軽く触れつつルール遵守。
- 参加者層: 初心者(エラー報告多め)〜上級者(ワークフロー共有、モデル検証)。Discord/Reddit/Civitai参照推奨。
主要トピックまとめ
- SDXLでの人物位置制御/ランダム配置 (»16, »29, »31, »34, »37, »39, »46, »51, »62)
- 課題: 人物が中央揃えになりやすく、端寄せ/ランダム散らしが難しい(学習データが中央寄りイラスト中心のため)。
- 解決策:
| 方法 | 詳細 | 適性 |
|——|——|——|
| プロンプト領域指定/i2i/ControlNet | 下絵で位置固定。 | ローカル限定 |
| ADetailer + ガキ追加トリック | 本命以外に子キャラ追加→human検出→マスク反転→solo書き直し。 | ランダム風ガチャ |
| QIE/SAM3 | 位置移動後修正。背景維持にSAM3最適(マスク調整で柔軟)。 | 後処理 |
| scenery強調/クオリティタグ除去 (masterpiece/best quality外す) | 多少ランダム化。4Kタグはノイズ。 | プロンプトのみ |
| ベースモデル使用 | マージモデル(WAI/hakushimix/ghostxl)は中央寄り。ghostxlでばらつき多め。 | 多様性重視 |
- 検証結果: ghostxl > conceptor > hakushimix(中央揃え耐性)。魔人世代モデルがランダム強い。
- 音声合成/TTS (Style-Bert-VITS2, »14, »21, »24, »65, »203, »206-208)
- トラブル: av==10.0.0でTextToSpeech動くがTextSpeechToSpeechエラー。DockerfileをStyle-Bert-VITS2ディレクトリでbuild。
- Tips: Discord技術者相談推奨。Wanベース+InfiniteTalkで動画音声合成例あり。喘ぎ声はT5Gemma最適(テキスト依存)。Llasa系は参照音声で喘ぎ再現可だが常時化注意。GPT-SoVITS-v4でゼロショット便利だがエロ声弱め。
- リアルタイム志向: 1秒ラグTTS希望。エロ/通常会話判定で参照切り替え実験中。
- LoRA学習/ツールトラブル (»47, »58-64, »74, »80, »102, »106, »144)
- クリス再学習例: PC8801ドット絵ベース強め、NSFW調整必要。レトロキャラはブルーオーシャン。
- traintrainトラブル: torchao (12/9追加)が原因→ブランチver4前へ downgrade(Standalone README参照)。拡張版必須(ADDifTバグ)。webui砲でADDifT成功例。
- タグ付け: BooruDatasetTagManager推奨。sd-script代替。
- Kohya_LoRA_param_GUI: xformers未インストールエラー(OS再インストール後)。Easyreforgeでpanties around one leg解決。
- 動画生成 (WanVideo/LTX-2/SVI, »65, »69-72, »77, »107, »142-148, »167)
- ワークフロー: WanVideoWrapper中心。「隣の撮影ブースに歩いて移動」プロンプトでシームレス背景切り替え(Start/End + ImageToVideo Encodeノード)。Lightning LoRAで安定。
- メモリ: RAM64GBで小動画可(WAN2.1時VRAM16GB+64GBでSSD漏れ)。96GB推奨。ComfyUI FP8(BF16)使用。
- トラブル: SmoothMix V2でEasyWan22真っ黒→ComfyUIアプデ/ggufモデルで解決。
- ポテンシャル: 1枚画像→分割無し長時間アニメ(z-image→wan2.2→LTX-2)。欧米人化注意(dashiwa low側で二次安定)。
- AI漫画作成 (»151〜, »160-166, »172, »175〜)
- 課題: 同一性破綻(オリキャラ特に)、背景/構図拘束難、表情大袈裟。カメラワーク/Edit系AIで一部解決可。
- ローカル vs NovelAI:
| ツール | 利点 | 欠点 |
|——–|——|——|
| ローカル(ComfyUI/SDXL) | LoRAでキャラ安定、コマ単位i2i/レイヤー配置。背景別生成。 | 習得コスト高(ノードいじり)。 |
| NovelAI | 版権キャラ強い。i2i清書可。 | オリキャラ同一性弱、プロンプト必須/Anlas課金。背景込みエロ無理。 |
- 実践Tips: 1コマ1コマ生成→手動配置/セリフ入れ(クリスタ併用)。背景飛ばしOK。コマ割り知識必須(歴史的手法活用)。売上例: SDメイン+クリスタ、NAI v4.5少数派。
- 限界: ポン出しマスピ顔多め。CG集推奨。Zimage日本語擬音追加希望。
- その他Tips/雑談
- 肌表現: oily skin(ヌルヌル)> shiny skin(似通うがベタベタ化注意)。
- 検出モデル: SAM3最強(人間bbox/唇マスク)。ADetailer+illustrious系。
- PCスペック: GPU2台積み/別PC共有推奨(KM共有数千円)。RTX5090/5090ti/ PRO6000相談。スマホ/VM代替可。
- モデル動向: LTX-2惜しい、SVI停滞感。Hunyuan3D 3.1/Zimageベース公開待ち。
- 楽観/挫折: 生成2年でWFいじり増、LoRA作成ループ。行動力重要。
注目Tipsリスト(即実践可)
- SAM3: 背景維持/人間検出/Detailerに最適。
- クオリティタグ除去: 多様性向上(10枚テスト推奨)。
- clothed female nude male: 男だけ脱がせタグ。
- PC増設: ComfyUI公式テンプレで簡単。FP8→BF16でPRO6000最適化。
- 初心者: 1P完成から。Discord/Civitai/チャットAI活用。
結論/傾向分析
- 活発度: 技術共有熱く、相互ヘルプ多め(感謝レス多数)。SDXL→動画/漫画進化中だが、同一性/ランダム/エロ背景が永遠課題。
- 初心者アドバイス: 小さく始めて(1枚生成→コマ単位)。ComfyUIハードル高めだがWF共有豊富。ローカル推奨(オリジナル向き)。
- 次回注目: Zimage公開、漫画LoRA、リアルタイムTTS進化。スレ継続濃厚(無宣言OK)。
このレポートはログのエッセンスを抽出。詳細確認は元ログ推奨。追加質問あればどうぞ!