5chSummary

なんJ(5ch) AI生成スレッド ログレポート (投稿12〜226)

スレッド概要

主要トピックまとめ

  1. SDXLでの人物位置制御/ランダム配置 (»16, »29, »31, »34, »37, »39, »46, »51, »62)
    • 課題: 人物が中央揃えになりやすく、端寄せ/ランダム散らしが難しい(学習データが中央寄りイラスト中心のため)。
    • 解決策: | 方法 | 詳細 | 適性 | |——|——|——| | プロンプト領域指定/i2i/ControlNet | 下絵で位置固定。 | ローカル限定 | | ADetailer + ガキ追加トリック | 本命以外に子キャラ追加→human検出→マスク反転→solo書き直し。 | ランダム風ガチャ | | QIE/SAM3 | 位置移動後修正。背景維持にSAM3最適(マスク調整で柔軟)。 | 後処理 | | scenery強調/クオリティタグ除去 (masterpiece/best quality外す) | 多少ランダム化。4Kタグはノイズ。 | プロンプトのみ | | ベースモデル使用 | マージモデル(WAI/hakushimix/ghostxl)は中央寄り。ghostxlでばらつき多め。 | 多様性重視 |
    • 検証結果: ghostxl > conceptor > hakushimix(中央揃え耐性)。魔人世代モデルがランダム強い。
  2. 音声合成/TTS (Style-Bert-VITS2, »14, »21, »24, »65, »203, »206-208)
    • トラブル: av==10.0.0でTextToSpeech動くがTextSpeechToSpeechエラー。DockerfileをStyle-Bert-VITS2ディレクトリでbuild。
    • Tips: Discord技術者相談推奨。Wanベース+InfiniteTalkで動画音声合成例あり。喘ぎ声はT5Gemma最適(テキスト依存)。Llasa系は参照音声で喘ぎ再現可だが常時化注意。GPT-SoVITS-v4でゼロショット便利だがエロ声弱め。
    • リアルタイム志向: 1秒ラグTTS希望。エロ/通常会話判定で参照切り替え実験中。
  3. LoRA学習/ツールトラブル (»47, »58-64, »74, »80, »102, »106, »144)
    • クリス再学習例: PC8801ドット絵ベース強め、NSFW調整必要。レトロキャラはブルーオーシャン。
    • traintrainトラブル: torchao (12/9追加)が原因→ブランチver4前へ downgrade(Standalone README参照)。拡張版必須(ADDifTバグ)。webui砲でADDifT成功例。
    • タグ付け: BooruDatasetTagManager推奨。sd-script代替。
    • Kohya_LoRA_param_GUI: xformers未インストールエラー(OS再インストール後)。Easyreforgeでpanties around one leg解決。
  4. 動画生成 (WanVideo/LTX-2/SVI, »65, »69-72, »77, »107, »142-148, »167)
    • ワークフロー: WanVideoWrapper中心。「隣の撮影ブースに歩いて移動」プロンプトでシームレス背景切り替え(Start/End + ImageToVideo Encodeノード)。Lightning LoRAで安定。
    • メモリ: RAM64GBで小動画可(WAN2.1時VRAM16GB+64GBでSSD漏れ)。96GB推奨。ComfyUI FP8(BF16)使用。
    • トラブル: SmoothMix V2でEasyWan22真っ黒→ComfyUIアプデ/ggufモデルで解決。
    • ポテンシャル: 1枚画像→分割無し長時間アニメ(z-image→wan2.2→LTX-2)。欧米人化注意(dashiwa low側で二次安定)。
  5. AI漫画作成 (»151〜, »160-166, »172, »175〜)
    • 課題: 同一性破綻(オリキャラ特に)、背景/構図拘束難、表情大袈裟。カメラワーク/Edit系AIで一部解決可。
    • ローカル vs NovelAI: | ツール | 利点 | 欠点 | |——–|——|——| | ローカル(ComfyUI/SDXL) | LoRAでキャラ安定、コマ単位i2i/レイヤー配置。背景別生成。 | 習得コスト高(ノードいじり)。 | | NovelAI | 版権キャラ強い。i2i清書可。 | オリキャラ同一性弱、プロンプト必須/Anlas課金。背景込みエロ無理。 |
    • 実践Tips: 1コマ1コマ生成→手動配置/セリフ入れ(クリスタ併用)。背景飛ばしOK。コマ割り知識必須(歴史的手法活用)。売上例: SDメイン+クリスタ、NAI v4.5少数派。
    • 限界: ポン出しマスピ顔多め。CG集推奨。Zimage日本語擬音追加希望。
  6. その他Tips/雑談
    • 肌表現: oily skin(ヌルヌル)> shiny skin(似通うがベタベタ化注意)。
    • 検出モデル: SAM3最強(人間bbox/唇マスク)。ADetailer+illustrious系。
    • PCスペック: GPU2台積み/別PC共有推奨(KM共有数千円)。RTX5090/5090ti/ PRO6000相談。スマホ/VM代替可。
    • モデル動向: LTX-2惜しい、SVI停滞感。Hunyuan3D 3.1/Zimageベース公開待ち。
    • 楽観/挫折: 生成2年でWFいじり増、LoRA作成ループ。行動力重要。

注目Tipsリスト(即実践可)

結論/傾向分析

このレポートはログのエッセンスを抽出。詳細確認は元ログ推奨。追加質問あればどうぞ!