抽出結果: 指定モデルに関する話題
ログ全体(12〜226)をスキャンし、以下の指定モデル(NovelAI (NAI), Pony, illustrious(イラストリアス, リアス,ill,IL), Noobai, FLUX, Wan, Qwen)に関する言及をすべて抽出。Pony, Noobai, FLUXは一切言及なし。illustriousは「illustrious系」として1件。Wan, Qwen, NovelAIは複数あり、特に選定理由が明示されているものを強調。
NovelAI (NAI)
- 151: NovelAIを使うかローカルか悩む文脈で言及(エロ漫画作成)。理由: チャッピー(おそらくChatGPT?)が生成してくれないため、NAIを検討。
- 153: NovelAIでラフ入力→i2iでエロ漫画対応可能か? 理由: 背景込み仕上げは無理だが、背景無しなら手作業でいける。ローカルより習得コスト低いが、工夫が必要。
- 154: novelaiでi2iで形に?セリフ手入力前提。理由: ラフとコマ割り対応の可能性。
- 159: NovelAIでi2i多用ならAnlas課金必要か? 理由: エロ漫画のキャラ仕上げに検討、Proプラン課金前提。
- 162: Geminiでネーム→naiに突っ込むが無理。理由: ネーム単位生成不可、同一性保てず。
- 163: NAIは賢くない(i2i清書不可)。
- 175: NAIかローカルか悩み、チャッピーがエロNGのためNAI検討。理由: エロ絵生成でチャッピーNG。
- 181: NAIは二次創作ならモデル内蔵でOK、オリジナルはLoRA必要でローカル推奨。理由: 二次なら同一性保てるが、オリジナルキャラの同一性破綻を避けるため不向き。
- 183: NAIは画像補正が全然違う絵になる、プロンプト必須でAnlas消費激しい。理由: 期待した自動補正ができず不満。
- 184: naiv4.5で漫画作成中だがプロンプト難しく、他ユーザー少ない。理由: 漫画で使用中だが難易度高。
- 190: AI漫画の同一性ならNAI余裕、有料ハードル高いのが9割。
- 192: naiはdanbooru多めの版権キャラのみ同一性保てる、漫画ツールとして厳しい。
- 193: naiメインだが漫画厳しい。
選定理由まとめ: 主にエロ漫画/イラスト作成で検討。二次創作の同一性・モデル内蔵が強みだが、オリジナルキャラの同一性破綻、プロンプト依存の高さ、安易なi2i期待外れでローカル推奨の声多し。課金(Pro/Anlas)前提。
illustrious (イラストリアス, リアス, ill, IL)
- 61: ghostxlで生成後、adetailerをillustrious系でやるのが良いかも。理由: 構図ランダム性向上のため、ghostxl(ベース)と組み合わせ(adetailerで詳細修正)。
選定理由まとめ: adetailer(人間検出/修正)用途でghostxlと併用。位置/構図調整に特化。
Wan
- 62: ベースモデルとしてWAI(Wan系?)言及、真ん中1girl配置の弊害。
- 65: Style-Bert-VITS2音声をWanベースでInfiniteTalk使用。理由: 動画生成(シームレス場面切り替え)で音声合成。
- 69: WanVideoWrapperノード中心WF、LoRA=Lightning使用、背景シームレス切り替え上手い。理由: プロンプト指定で場面切り替え自然。
- 70: 「WanVideo ImageToVideo Encode」ノード重要。理由: Start/End生成動画接続。
- 107: wan2.2 -> LTX-2で乳ポロリ/vaginal変更、声/吐息良い。理由: 動画生成でエロ表現(弟の外人嫁設定)。
- 143: EasyWan22のWFでSmoothMix新版が真っ黒。理由: 動画生成WF使用中、トラブル。
- 145: WAN2.1でVRAM16GB/メイン64GBでSSD漏れ、96GB推奨。理由: 動画生成のRAM/VRAM消費大(画面サイズ/秒数抑え可)。
- 167: 1枚写真からwan2.2 -> LTX-2で分割無し動くポテンシャル高。理由: 静止画→動画変換、タイミング音声同期。
選定理由まとめ: 動画生成(ImageToVideo, 場面シームレス切り替え、背景維持、エロ表現)で多用。背景/動き自然、ノード/WF便利だがRAM/VRAM食い。SmoothMix併用トラブル報告。
Qwen
- 20: QIEで位置動かし(位置寄せ後維持)。理由: SDXLで人物端寄せ、i2i/SAM修正後。
- 149: qwenで裸エプロンシリーズ(カフェ/厨房/屋台編)。理由: イラスト生成(シリーズ物)。
選定理由まとめ: 位置調整(QIE)、イラストシリーズ生成に使用。理由明示薄いが、プロンプト指定の柔軟性示唆。
生成AIモデルに関する話題抽出(除外モデル除く)
ログから除外リスト外の生成AIモデル(主に画像/動画生成モデル、TTS含む)に関する言及を抽出。文脈と選定理由(利点・欠点含む)を簡潔にまとめ、各モデルの登場箇所を記載。LoRAやツール(SAM3, ADetailer等)はモデル本体でない限り除外。
SDXL
- 話題概要: 人物を端に寄せるのが難しく、中央配置になりやすい(学習元が中央寄りイラスト中心のため)。プロンプトのみで位置制御不可、ランダム配置も厳しい。クオリティタグ(masterpiece等)の影響大。背景強調で多少改善の可能性。
- 選定理由/文脈: ローカル生成のベースとして頻出。hakushimix/conceptor/ghostxl等の「魔人世代」と比較され、中央寄せの欠点が目立つ(»16,29,31,34,37,45,46,51,62,71,172)。
- 登場箇所: »16,29,31,34,37,45,46,51,62,71,172。
ghostxl
- 話題概要: SDXL系で比較的ばらけやすい(中央整列しにくい)。ランダム配置テストで14/20成功。
- 選定理由/文脈: ランダム構図狙いで優位。illustrious系ADetailerとの併用提案(»46,51,61)。
- 登場箇所: »46,51,61。
hakushimix
- 話題概要: 中央に整列しやすい。ランダム配置テストで4/20成功。
- 選定理由/文脈: ghostxl/conceptorと比較し、ランダム性が弱い新しめモデル例(»46,51)。
- 登場箇所: »46,51。
conceptor
- 話題概要: ランダム配置テストで8/20成功。
- 選定理由/文脈: 「魔人世代」としてランダム力強いと評価(»51)。
- 登場箇所: »51。
WAI (マージモデル)
- 話題概要: ベース/マージモデルとして1girl中央配置が出やすい。
- 選定理由/文脈: 構図ランダム性上げたい場合に推奨。他マージ同様学習バイアス強い(»62)。
- 登場箇所: »62。
dashiwa
- 話題概要: low側使用で二次絵の顔が安定。
- 選定理由/文脈: 顔安定目的で推奨(»89,99)。
- 登場箇所: »89,99。
LTX-2
- 話題概要: 動画生成でポテンシャル高(タイミング良い音声同期、謎技術)。惜しい点あり(»147)。SVI/LTX-2登場後停滞感(»136)。z-image/wan2.2とのチェインで高品質動画(»167)。
- 選定理由/文脈: 動画/アニメーション向き、音声同期優秀(»77,136,147,167)。
- 登場箇所: »77,107,136,147,167。
SVI (svi?)
- 話題概要: LTX-2と並んで新技術例。v2v対応。
- 選定理由/文脈: LTX-2とセットで動画生成期待(»77,136)。
- 登場箇所: »77,136。
SmoothMix (v2含む)
- 話題概要: 新しいv2がEasyWan22で真っ黒エラー(ComfyUIアプデ必要?)。ggufモデル使用でeasy環境対応可(質低下不明)。
- 選定理由/文脈: 動画生成WFで使用、互換性問題指摘(»100,143,146,148,171,173)。
- 登場箇所: »100,143,146,148,171,173。
Zimage (z-image)
- 話題概要: SDXL比で「夢がある」(タガー方式超え)。ベース未公開? セリフ/擬音追加学習期待。wan2.2/LTX-2チェインで高品質動画起点。
- 選定理由/文脈: 漫画/動画の同一性・表現力で優位(»167,176,224)。
- 登場箇所: »167,176,224。
T5Gemma (TTSモデル: T5Gemma-TTS)
- 話題概要: テキスト内容で喘ぎ声等変化(エロ/通常判定)。音質変化ガチャ器として活用。リアルタイム非対応。
- 選定理由/文脈: 喘ぎ声生成に最適、他TTS(Llasa等)と比較優位(»203,208)。
- 登場箇所: »203,208。
その他マイナー言及
- Style-Bert-VITS2: Docker起動/音声生成話題(»21)。理由: Discord技術者集団活用推奨(»24)。
- GPT-SoVITS (v3/v4): ゼロショット音声便利だが喘ぎ/ささやき弱い(»206,208)。
- TsukasaSpeech, Llasa系 (AnimeLlasa, GalgeLlasa): 参照音声依存で喘ぎ声生成可だが自然さ不足(»203,206,207,208)。
全体傾向: SDXL系が位置/ランダム構図の課題で議論中心。動画モデル(LTX-2, SVI, Zimage)はポテンシャル高評価。TTSはエロ音声特化でT5Gemma優位。除外モデル(Wan/Qwen等)はログ多かったが除外済み。