NovelAI (NAI)
- 444: NAIのアプデは良いが、ポーションの方がanlas無しで使える事を考えると使う理由が薄い。素直に参照キャラ増やすモデルのアップデートを頼みたい(理由: anlas消費を避けたいためポーション優先)。
- 449: NAIちゃんの精密参照かなり遊べるしLoRA素材作りに便利そう。適当なフィギャーの画像とアルカナちゃんの公式画像の2つで捗る画像が作れてしまう。ただもちもちほっぺ大作戦は微妙なニュアンスが厳しい(理由: 精密参照がLoRA素材作成に便利で効率的)。
- 455: NAIちゃんはいつSMEA復活させるんだい?(SMEA復活を望む)。
- 496: 前スレでちらっと出てたnaiのタグバトルシステムやけどComfyUIのapi使うように改造したらnai無しローカルで使えるようになった。好きな服タグランキングとか応用もできておもしろい(理由: ローカルでnai無しで使えるよう改造し、応用性が高い)。
- 516: タグバトルシステムって何?熱そう。NAI課金プランの相談しよか思とったレベル(タグバトルシステムに興味、課金検討)。
- 593: NAIちゃんもしっかり進化しとる(進化を評価)。
- 597: NAIの精密参照アプデ。これデータベースも更新されてる気がする。つい先週までプロンプトじゃ出なかったキャラが出るようになってる(理由: アプデでDB更新?出力精度向上)。
- 624: NAIの参照機能はこれまでのとは別により大きなモデル動かしてるって言うからノーコストでは無理。将来的にAIサーバ強化や軽量化でNAI v5.0として出るかも(理由: 大きなモデル使用のため高品質だがコストかかる。将来的期待)。
- 625: アニメ特化の参照機能付きモデルはワイが渇望してる(理由: アニメ特化参照を強く望む)。
- 633: NAIの精密参照アプデ。これデータベースも更新されてる気がするんだが気の所為? つい先週までプロンプトじゃ出なかったキャラが出るようになってる(理由: アプデで出力精度向上、DB更新疑い)。
illustrious (イラストリアス, リアス, ill, IL)
- 503: danbooruタグを自然言語のキャプションに変換する方法ってある? 昔イラストリアス用に用意した学習素材をもとにZIBで学習させたい(理由: 過去に用意したイラストリアス用学習素材を活用したい)。
- 603: redditの絵師蠱毒システム。AGに頼んでReforgeのapi叩いてリアス系モデルから画像出してくれるように書き換え(理由: リアス系モデルで画像生成、比較実験に使用)。
Qwen
- 467: aceもqwenか。大手のLLMが話題になってるけどアメリカを中心とした企業がローカルLLMでqwen採用しまくっててローカルではqwenが圧倒的とか報道されてるが、ローカル新モデルを見てるとそれを実感するな(理由: ローカルLLMでqwenが圧倒的に採用・優位)。
- 506: もうちょいまともにやるならNSFWQwenVLで画像→自然言語キャプションを追加(理由: 画像から自然言語キャプション生成に使用、エロチューン不足を補う)。
Wan
- 531: 今まで動いてたWanが動かなくて困ったんやが、rgthree-comfyがNode2.0非対応のせいだった(理由: 環境互換性問題(Node2.0非対応)で動かなくなる)。
- 611: 非量子化モデルで–fast dynamic_vramオプション実行すると動作する。「Model WAN21 prepared for dynamic VRAM loading」(理由: dynamic_vramオプションでVRAM効率化、低スペック対応)。
- 621: TEとVAEにはdynamic_vramが効くようだから、例えばWanのHighとLowにGGUFを使っていても可能ならONしてもいいかも(理由: GGUF使用時もdynamic_vramでVRAM最適化可能)。
Pony / Noobai / FLUX
抽出された生成AIモデル関連話題(除外モデル除く)
ログから除外モデル(NovelAI/NAI, Pony, illustrious/イラストリアス/リアス/ill/IL, Noobai, FLUX, Wan, Qwen)を除いた上で、「モデル」に関する話題を抽出。主に画像生成・音楽生成モデルに言及あり。モデルごとに話題をまとめ、特に選ばれている/評価されている理由を太字で強調。
Anima(画像生成モデル、主にComfyUI対応)
- 最多言及モデル。LoRA学習、ftモデル、WF、強調構文、手書き擬装、自然言語プロンプトの強みなどが話題の中心。
- 433: WFが単純で「ほぼSDやん」と思えるほど扱いやすい(簡単さが評価)。
- 434: LoRA学習と学習GUI、ftモデルを早く出してほしい。
- 448: 他の画像よりAnimaの凄さがわかる。
- 454: anima用体型ワイルドカード追加修正中、強調効きにくい・陰毛濃い問題。
- 457: 手書き擬装特化(線太くよれよれ、色単調)。
- 460: AIらしさ少なく、手描きの味わい必要。ftモデル・LoRA学習環境・GUI待ちで移行予定(学習環境待ちが移行理由)。
- 468: diffusion-pipeのanima用派生フォークでLoRA学習可能。kohya/musubi-tuner/AI-toolkit待ち。
- 490: WSLでLoRA学習成功、VRAM10.1GB(SDXL並みだが少ないかと思った)。
- 504: 絵柄LoRA学習速い(4060ti、1024解像、1ステップ3.3秒、14枚50epochで45分、再現度良い)(SDXLと同じ感覚で学習可能・速さが魅力)。
- 507: SDXL感覚で学習可能、これからLoRA続々(LoRA適性高く期待大)。
- 510: 能力高くSDXLを過去にする(SDXL超えの能力)。
- 517: キャラLoRA素直に学習、細部まで覚え良い(SDXLより覚えが良い)。
- 519: LoRA短時間で作れるなら勝ち、WSLインストールして挑戦。
- 535: LoRA学習だけならdiffusion-pipe(Linux/WSL限定)。
- 539-544,551: 強調構文(例: (3D:0.1) vs (3D:5))が効く(gigantic breasts:5で巨大化)。v0.12.0でもT5側重み有効?(強調効く点が理想的)。
- 553: DanbooruタグOK、自然言語OK、強調OK。理想のモデル(多様なプロンプト対応)。
- 566: 「キャラA アクション to キャラB」読んでくれる革命的(newbie/netalumina無理)。
- 587: ハーレム/乱交構図狙いプロンプトでブレるが期待。
- 591: sd-scriptsにanima LoRAスクリプト実装。
- 595-599: 速度遅め(4070tiで38秒)がSDXL倍程度。
- 601: ComfyUI-ppmでnegPiP対応。
- 604: いいね。
- 全体理由まとめ: SDXLより軽量・高能力・LoRA学習速い・自然言語/強調強い・手書き風・輪郭線明確で人気。ComfyUI v0.12.0対応で移行加速。
ACE-Step 1.5(音楽生成モデル、ComfyUI対応)
- 438: ComfyUI v0.12.0にノード/WF追加(モデルDL待ち)。
- 440: 楽しみ、HeartMuLa超え?
- 446: 昔は曲/音質/日本語ゴミ。
- 447: SUNO v4.5/v5相当品質、turboでスンスン案件?
- 458: 生きてた、多言語対応、歌詞付きでHeartMuLa超え?インスト強い(歌詞付き/インスト対応が魅力)。
- 609: 来た。
- 610: 日本語HeartMuLa並、テンプレk-popで歌詞調整可能、bpm/キー指定大(日本語改善・bpm指定でバラード以外対応)。
- 614: ACEModelLoaderノード行方不明で試せず。
- 615: 声反響/音割れ残る?曲調影響か、日本語はHeartMuLa良いかも。
- 618: テンプレ入って導入楽、歌無しOK、旧版削除可(導入楽・汎用性)。
- 620: 自然言語/曲調優先でインスト可、歌詞暴走注意(HeartMuLaはタグ/歌詞優先でインスト難)。
- 626: ComfyUI v0.12.1がace step関連アプデ多。
- 全体理由まとめ: HeartMuLa超えの品質向上、日本語改善、bpm指定、自然言語インスト対応、ComfyUI導入楽で期待。
HeartMuLa(音楽生成モデル、比較対象)
- 440: ACE-Step超え?
- 458: 歌詞付きでACE超え?
- 610: 日本語良い。
- 615: 日本語良い、声反響なし?
- 616: バラードオンリー気味(bpm指定なしがデメリット)。
- 620: タグ/歌詞優先でインスト難。
- 理由: 日本語強いが曲調制限(バラードオンリー)でACEに劣る。
Z-image / ZI / ZI-B(画像生成モデル?)
- 503: ZIBで学習(danbooruタグ→自然言語)。
- 506: Step数上げるとロス上がる問題、Zimageお亡くなりコース?
- 511: forge neoでSSDガリガリ。
- 512: 安定性悪くComfyUIバージョンで起動失敗。
- 572: ZI撤退、SDXLに戻る。
- 602: zit試せてないのにanimaへ。
- 理由: 安定性/動作問題多発で撤退要因。
LTX2(画像/動画生成モデル?)
- 627: Max Payne introシーン作成可能、使い方次第で高性能(Reddit)。
- 理由: 高品質シーン生成可能。
その他マイナー言及
- SVI: 553でRTX50系動作確認要請(音声?)。
- Style-Bert-VITS2: 554でRTX50系学習動かず(音声生成)。
全体傾向: Animaが圧倒的中心でLoRA/ComfyUI適性高く移行推奨。ACE-Stepは音楽でHeartMuLa超え期待。安定性重視でSDXL回帰も。