その他モデル: | モデル | 評価 | 備考 | |——–|——|——| | Pony系 | 海外一部使用も「時代遅れ」 | 派生model主流? | | Illustrious | 過去主流、現在更新で追いつけ? NSFW弱め | ComfyUIベース | | SD1.5 | HF DL数多(A1111自動DL要因)。Pixiv1-2割現役、リアル有利 | SDXL超え無根拠論争 | | SDXL | NSFW強い。風景/オブジェクト微妙 | Anima/SDXL主流 |
Irodori-TTS(Emoji-TTS fork): | 問題 | 解決策 | |——|——–| | uv syncエラー(sentencepiece) | uv pip install faster-whisper(Whisper自動DL)。requirements.txt更新必須。 | | データセット前処理エラー(CSV) | JSONL出力(audio_path/text列名)。ラベル1行目列名ミス注意(file_name→audio)。 | | LoRA学習失敗(空フォルダ) | 出力パス明記。2800stepで変化なし→パラメータ調整/FT推奨。声高くなる→おっさんデータバランス。 | | キャプション生成スキップ | uv pip install requirements.txtで不足ライブラリ補完。 |
このレポートはログのエッセンスを抽出。詳細ログ参照推奨。質問あれば追加分析可能。