以下は、提供された5chログ(637〜836)から、指定された生成AIのモデル(NovelAI (NAI), Pony, illustrious(イラストリアス, リアス,ill,IL), Noobai, FLUX, Wan, Qwen)に関する話題をすべて抽出したものです。抽出の基準は以下の通りです:
- ログ内でこれらのモデル名(または指定された別称)が明示的に言及されている部分を対象としました。
- 関連する文脈全体を引用し、モデルに関する話題をまとめています。
- 特に、そのモデルが選ばれている理由(例: 性能、使いやすさ、特定の機能など)が述べられている場合、それを明示的に抽出・強調しています。
- 言及がないモデルについては「言及なし」と記載。
- 抽出はログの投稿番号順に整理しています。
NovelAI (NAI)
Pony
- 759: 「Ponyの話は…」
- 話題: Ponyに関する話題の欠如を指摘する短い言及。詳細な議論なし。
- 765: 「SD1.5を思い出させる出来であった」
- 話題: Ponyの生成結果がSD1.5を連想させるという評価(文脈からPonyの品質について)。
- 766: 「PonyV7の話聞いて浦島から戻ってきたけど ニキ達の評判見るにイマイチかぁ… 竜宮城へ帰らせてもらう」
- 話題: PonyV7の評判が悪いという評価。選ばれている理由: 特に理由は述べられず、むしろ評判の悪さから避けられるニュアンス(イマイチなので戻る)。
illustrious(イラストリアス, リアス,ill,IL)
- 768: 「というかSDXLのリアスのハードルが高すぎる 次世代組エロイラストチューンのNetaYumeLuminaも結局LoRA環境の部分が整ってなくて誰も使わんだしな」
- 話題: SDXLのリアス(illustriousの別称)のハードルが高いという指摘。選ばれている理由: 特に理由は述べられず、むしろハードルの高さ(導入の難しさ)がネガティブに評価されている。
Noobai
FLUX
Wan
- 698: 「smoothMixWan22I2VT2V_i2vHigh.safetensorsを"E:ComfyUI\models\checkpoints"に入れても公式ワークフローのチェックポイント読み込みの欄に出てこないんだけど入れるところ間違ってる? vaeとclipは正常に反応するんやけどチェックポイントだけうんともすんとも言わへん」
- 話題: smoothMixWan22I2VT2V_i2vHigh.safetensors(Wan関連のモデル)の配置エラーと解決。選ばれている理由: 特に理由は述べられず、ワークフローでの使用を前提としたトラブルシューティング。
- 699: 「すまん解決した unetフォルダにいれなあかんかったんやな」
- 話題: 上記の続きで、Wanモデルの正しい配置方法の解決。
- 706: 「とりあえずワイ環4060ti VRAM16GBのRAM64GBでsmoothwan公式のワークフローを全くいじらずにそのままi2vで使用した結果 VRAM使用量90%~100% RAM使用量30GB前後 5秒の動画一回出すのに220秒やったわ アプスケ切ったら90秒やな 割とボリューム層のスペックやと思うし誰かの参考になれば」
- 話題: smoothwan(Wanのバリエーション)の公式ワークフローを使った動画生成のスペックと結果。選ばれている理由: 動画生成(i2v)のために使用されており、スペック要件の参考として共有(VRAM16GB/RAM64GBで動作可能だが時間かかる)。
- 710: 「EasyWan22とか新たに構築したポータブル版だとドツボに嵌る」
- 話題: EasyWan22の環境構築の難しさ。選ばれている理由: 特に理由は述べられず、むしろ構築の難易度が高い点が指摘されている。
- 758: 「(なんだ…?Smoothmixの動きスゲーって感動している間に何が起きている…?)」
- 話題: Smoothmix(Wan関連のモデル)の動きの良さに感動。選ばれている理由: 動きのクオリティが高いため(スゲーという評価)。
Qwen
- 638: 「Qwen-Image-Edit-Rapid-AIOを試したくてはじめてcomfyuiのワークフローを触ります 以下ページの説明にある画像と同じワークフローを作りたいですが、jsonが配布されて無い場合は目視で真似するしかないんですかね?」
- 話題: Qwen-Image-Edit-Rapid-AIOのワークフロー作成の試み。選ばれている理由: 画像編集(Image-Edit)を試したいため。
- 639: 「すんません配布されてました・・・」
- 話題: 上記の続きで、Qwen関連のJSONが配布されていることの確認。
- 649: 「つーかQwen-Rapid-AIO.jsonがワークフローじゃん sssp://o.5ch.net/25w4d.png」
- 話題: Qwen-Rapid-AIO.jsonのワークフローとしての言及。
- 697: 「qwen image edit rapid aio 使ってる人らに聞きたいんだけど 推奨設定だと横縞状のノイズっぽいの乗ってて気にならん? civitai見ててもaioで生成したっぽい画像にはもれなく同じ現象起きててめちゃくちゃ気になるんだよな サンプラーとか変えてステップ増やせばノイズが乗りにくい組み合わせもあるんだけど、推奨値じゃないからか品質悪くなったりしてどうにも難しい」
- 話題: qwen image edit rapid aioのノイズ問題と設定調整。選ばれている理由: 画像編集の推奨設定を使っているが、ノイズが気になるため調整中(品質向上のため)。
- 716: 「今は動画、音声が流行りや 画像はqwen comfyがイジれないなら話にのれない」
- 話題: 画像生成ではqwenが流行り。選ばれている理由: 画像生成のトレンドとして(動画・音声の流行りと対比)。
- 727: 「qwen image edit rapid aio(エロLoRA込みのオールインワン)を使って エロゲのモザイクあり画像入力→「モザイク消して」で消せるか試した 意図通り、ちゃんとモザイクを消したうえで女性器やチンポコを描く、モザイク部分以外は手を出さないのは偉い が、全然エロくない、なんとも無難な感じに描かれるし、挿入済み結合部分は精度の問題で無理そう(女性器がチンコで完全分断されたり、亀頭が男の胴体側に描かれたり) まだSDXLのインペイントが現実路線かという状況、意図が日本語でちゃんと伝わるのはいい感触はしているんだけどな」
- 話題: qwen image edit rapid aio(エロLoRA込み)のモザイク除去テスト。選ばれている理由: エロ画像のモザイク除去と編集のため(意図が日本語で伝わる点が良い評価)。ただし、エロさの不足や精度の問題が指摘。
- 809: 「ComfyUIの接続を見やすくしてくれる「かもしれない」Quick Connectionsが紹介されていたので試してみた (…) FlowはDisTorch2MultiGPUでQwen-Edit-2509をQwen-Image-Edit-Lightning-8stepsでCFG=1, 8Stepで使ってみるテスト用(24GVRAM+96G Mem) 一応8bit版にも切り替えられる」
- 話題: Qwen-Edit-2509とQwen-Image-Edit-Lightning-8stepsのワークフローでの使用テスト。選ばれている理由: 画像編集の高速化(Lightning-8steps)とメモリ効率(8bit版切り替え)でテスト中。スペック(24G VRAM+96G Mem)での動作確認。
以下は、提供された5chログから抽出された生成AIの「モデル」に関する話題のまとめです。抽出の基準は以下の通りです:
- 生成AIのモデル名(またはそれに準ずるもの)が明確に言及されている部分を対象とし、除外リスト(NovelAI (NAI), Pony, illustrious(イラストリアス, リアス, ill, IL), Noobai, FLUX, Wan, Qwen)に該当するものは除外。
- 一般的なツール名(例: TensorRT, ComfyUI, LoRA学習ツールなど)やワークフロー、GPUスペック、プロンプトの議論はモデル本体に関するものではないため除外。
- 特にモデルが選ばれている理由(例: 検閲の緩さ、生成の自然さ、メモリ効率など)が明記されている場合、それを抽出・記載。
- ログのレス番号を参考に、関連する話題をグループ化して整理。
抽出されたモデルと関連話題
1. Grok (xAIの生成AIモデル、画像/動画生成関連)
- 関連レス: 640, 641, 642, 643, 708, 812, 836。
- 抽出内容: Grokを使って画像生成(特にエロ画像)を行っている話題が複数。Grokで生成した画像を動画化したり、特定のシチュエーション(例: おっぱいが風船のように膨らむ描写、エロ蹲踞)で使ったりしている。
- 選ばれている理由: 検閲が緩い(アップロード画像に対する対策が厳しい他のモデルに比べて、Grok生成の画像はエロ描写が通りやすい)。例: 「grokに作らせた絵は検閲ユルめ」「grokでエロ蹲踞させるだけでも結構ええやん」。
2. Holocine (オープンソースの動画生成AIモデル)
- 関連レス: 653, 657, 665。
- 抽出内容: 最近リリースされたHolocineを試したいという話題。音声生成は無理だが、Sora2のような長尺動画(例: 5分弱)が作れる。モデルファイルとして「full_high_noise.safetensors」(57.2 GB)と「full_low_noise.safetensors」(57.2 GB)が言及され、ファイルサイズの大きさがハードルが高いと指摘。
- 選ばれている理由: 長尺動画生成が可能(Soraのような高品質な動画を目指せる)。ただし、お試しのハードルが高いため、実際に試した人は少ない様子。
3. Sora (OpenAIの動画生成AIモデル)
- 関連レス: 658, 673。
- 抽出内容: Soraを使った動画生成で、健全な画像でもコンテンツポリシー違反になりやすい。面白動画作成に向いているが、エロ系は通りにくい。
- 選ばれている理由: 1から面白動画を作るのに適しているが、ポリシー違反の頻度が高いため、エロ用途では不向き(例: 「soraはこのくらいでも頻繁にコンテンツポリシー違反になっちゃう」「soraは適当にポンだしした健全絵でもなんか通らないみたい時ある」)。
4. Anime-Llasa-3B-Captions (アニメ調音声生成モデル、Llasaベース)
- 関連レス: 662, 671, 683, 709, 715, 718, 720, 724, 728, 735, 748, 752, 754, 764, 775, 776, 784, 811, 814, 817。
- 抽出内容: Anime-Llasa-3B-Captions(およびそのDemo版)の導入・使用方法、生成例(特にエロ喘ぎ声、汚い喘ぎ声、ゾンビのような声)が多数議論。参照音声の使用でOOM(Out of Memory)エラーが起きやすい、声質のブレやセリフ抜けが発生する、Whisperとの連携でキャプション生成を行う点が話題。CPUオプション追加やパッチ作成の共有も。
- 選ばれている理由: アニメ調の自然なエロ音声(例: 喘ぎ声、うめき声)が生成可能で、雰囲気や声の高さを参照音声に似せられる。ただし、ガチャ要素が多く、結果のブレが大きい。EasyLlasaとの比較で、自然さでは上だが狙った声が出にくい(例: 「自然さではこちらが上だがリファレンス音声を使っても全然狙った通りにならない。ガチャ要素あり」「Anime-Llasaは結果と声質がぶれすぎるしセリフが抜けることが多い」)。VRAM12GB環境では参照音声使用時に重く、WhisperのCPU実行で軽減可能。
5. EasyLlasa (音声生成モデル、Llasaベース)
- 関連レス: 718, 719, 724, 729, 748, 750, 755, 767, 804。
- 抽出内容: EasyLlasaの使用例、特に参照音声の特徴をよく捉える点や喘ぎ声生成の議論。Anime-Llasaとの合体を望む声あり。ガチャが大変で心折れる、メモリ管理の工夫(sageattention導入)で高速化可能か検討。
- 選ばれている理由: 参照音声の特徴を正確に把握しながら喋ってくれるため、狙った声が出やすい(Anime-Llasaより優位)。ただし、ガチャ要素が多く心折れやすい(例: 「EasyLlasaの方が参照音声の特徴把握しながら喋ってくれるね」「EasyLlasaのほうはガチャ大変で心折れたんよなあ」)。喘ぎ声も出るが、アニメ声トレーニング品のため英語は苦手。
6. SDXL (Stable Diffusion XL、画像生成モデル)
- 関連レス: 651, 663, 664, 768。
- 抽出内容: SDXLのLoRA学習用オプティマイザ(Came, Prodigy, Lion, Radamschedulefreeなど)の選択や、学習ソースの扱い(彩度低下、立体的描写のフラット化、目の形の逸脱)が議論。学習はモデルが持つ概念によるため、ノウハウが秘伝のタレ状態。
- 選ばれている理由: LoRA学習で特殊な調整(例: sdxl-flatとの組み合わせでフラット化、CDTunerで彩度調整)が可能だが、オプティマイザの選択が難しく、画像公開の権利問題でノウハウ共有しにくい。リアリスティックなインペイントに適している(例: 「SDXLのLora学習用のオプティマイザって結局どれが一番いいんや?」)。
7. NetaYumeLumina (次世代エロイラストチューンモデル)
- 関連レス: 768, 785。
- 抽出内容: NetaYumeLuminaのLoRA学習をai toolkitやdiffusersで試すが、ComfyUIノード非対応で使えない。SDXLのリアリスティックさがハードル高い。
- 選ばれている理由: 次世代組のエロイラストチューンとして期待されるが、LoRA環境が整っていないため誰も使わない(例: 「次世代組エロイラストチューンのNetaYumeLuminaも結局LoRA環境の部分が整ってなくて誰も使わんだしな」)。
8. Whisper (音声認識モデル、various variants)
- 関連レス: 723, 733, 734, 761, 764, 775, 776。
- 抽出内容: Whisper(whisper-large-v3-turbo, anime-whisperなど)をキャプション生成に使用。音声をテキスト化し、Llasaモデルに連携。CPU実行オプションでメモリ節約可能。参照音声のキャプションを事前生成して時短。
- 選ばれている理由: 音声認識でキャプションを自動生成し、OOM回避や時短に役立つ。アニメ調に特化したanime-whisperが便利だが、CPUだと遅い(例: 「whisperでキャプション生成するのにメモリ食われるだけだからあらかじめキャプションをテキストで入力しておけば余裕」「whisperがCPUだと25%から50%に行く段階で結構遅くなる」)。
9. RVC (Retrieval-based Voice Conversion、ボイスチャンジャーモデル)
- 関連レス: 800, 805, 810。
- 抽出内容: RVCの進化を望む声。ボイスチャンジャーとして合成音声入力で疑似音声合成可能。SBV2と勘違いされる場合あり。
- 選ばれている理由: 声の変換に特化し、進化すればエロ音声生成に使えるが、現在は使い道が限られる(例: 「RVCでその進化を感じたかった」「RVCもまあ合成音声ソフトの出力を入力にすれば疑似音声合成できなくもない」)。
10. SBV2 (音声生成モデル、Silero TTSベース?)
- 関連レス: 805, 817。
- 抽出内容: SBV2の作例共有。Anime-Llasaと比較してガチャ要素が少なく、自然さで劣るが使いやすい。
- 選ばれている理由: リファレンス音声を使っても狙った通りになりやすく、使い分けが必要(Anime-Llasaより優位)。例: 「SBV2の方が使いやすい。使い分けが必要そう」。
抽出の補足
- 上記は除外リストに該当しないモデルに限定。例: PonyV7 (766)はPonyのため除外、Qwen関連 (638, 716, 727, 809)はQwenのため除外、SmoothMixWan (675, 698, 706)はWanのため除外。
- モデルが選ばれている理由は、ログ内で明確に議論されているものを抽出(例: 検閲の緩さ、自然さ、メモリ効率)。理由が不明瞭なものは記載せず。
- 全体として、ログは音声生成モデル(Anime-Llasa, EasyLlasaなど)の議論が多く、動画/画像生成(Grok, Sora, Holocine)と並行して進化の速さが話題になっている。