以下は、提供された5chログから、生成AIに関連する「ツール」に関する話題を抽出したものです。抽出の基準は指示通りとし、ツールとはComfyUI (comfy), A1111, webUI, SUPIR, nano-bananaなどのものを指します。モデル(NovelAI, Pony, illustrious, Noobai, FLUX, Wan, Qwenなど)に関する話題は一切抽出していません。また、ツールが選ばれている理由が明示的に述べられている場合、それも併せて記載します。抽出はログの番号を参考にし、重複を避けつつ関連する話題をまとめています。
nano-banana関連の話題
- (66) bananaはjpg出力だし解像度が毎回変わってアスペクト比変わるしで使いにくい。qwen image editのほうが良いなあ。まあ双方ともこれからドンドン改良されていくでしょう。(理由: bananaは出力形式や解像度の不安定さが使いにくいため、qwen image editの方が良いと比較)
- (68) bananaでほうきに乗せる(実際は杖に乗せると指示)。
- (88) Y「このbananaは出来損ないだ、食べられないよ」 G「1年後に来てください、本物のbananaをお見せしますよ」(ジョーク的な言及)。
- (108) バナナでここまでくらいの微エロ?なら全然いけるんか?すごe。
- (138) 多分そのうちポルノ系も1枚目の人物に2枚目の事をさせてっての出来るようになるんだろうけど Nano-banana並に一貫性保つなら、見抜くのが難しくなりそう。
- (176) nano-bananaのおかげでキャラlora素材無限に作れそうやな。
- (177) アウトペイントもたのしい …高画質で出せるプランとかないんか?
- (197) nano bananaでキャラLoRA素材作るのワイも考えたんやけどなんか大体合ってるけどよく見ると細部が微妙なこと多くないか?
- (208) テキストが被ってるのとか背景除去とかそれなりの精度なのでnanobananaちゃん使える。
- (228) bananaでtohka生成 なんか背景によってはスカートが再現しないな。
- (229) bananaはきれいにラフや線画出力してくれるな。
- (234) バナナ使いこなせば絶対便利だと分かってるのに、エロばっか出してたせいでどう使っていいかわからないのがワイです。
- (236) バナナ便利やけど画像生成しろっていってるのに はいわかりました画像を生成します と文字だけ返して終了するときあってなんだお前はってなること多いで。(理由: 便利だが、生成が不安定で文字だけ返ってくる場合があるため使いにくい)
ComfyUI関連の話題
- (50) qwen-image-editで1枚目の画像を2枚目の画像の服装に変えるって出来ると思うのだけれどcomfyuiがわからなすぎて出来ない 何処かにテンプレみたいの有る?
- (97) 高速化手法ということで、attention 関連やらvLLMやら 色んな手法がありますが。以前に質問させていただいたflash attention の原理がSRAMみたいなものというので、 ええ、そうなの?とか思ったり。 でNvidia 謹製のtenser RTというの入れてみたいなー とか考えてたのですが、どなたかcomfyのポータブル環境などで使われてる方はいますか?(理由: 高速化手法としてflash attentionやTensorRTをComfyUIのポータブル環境で試したい)
- (98) TensorRTは競合する依存関係がバチクソに厳しいので一撃でComfyUI環境を破壊出来るからマジでオススメしない easywan22勢ならPythonとか言われても「おっぱいの亜種か何かかな?」程度の認識やろうし余計にオススメしない。(理由: TensorRTは依存関係の競合でComfyUI環境を破壊するリスクが高いためオススメしない)
- (99) うはあ、そうでしたか。 型番にも依存するようなので、 やはりポータブルで実験してみます。聞いておいてよかったです。 ありがとうございます。 easywan22といえば、昨日kijaiさんのページでfp8のモデルが!! という記事読んで、うほっとか思い、ダウンロードしてたら、ん?!もしやと思い、easywan22のページ読んだら、もうすでに導入されてて入ってました。
- (100) あとは無事にTensorRT導入が綺麗に成功しても正直使えるシーンが限られてるから苦労に見合わないと思うで 特にいま流行のWan2.2には使えんしFluxやSD3.5をlora使わずに運用したい人向けやな。(理由: TensorRTは使えるシーンが限定的で、苦労に見合わない)
- (101) え゛そうなんですか。なんか、爆速になりそうで期待してたのですが?? 他にリソース割きます。重ねて助言感謝です。
- (103) あと、そういえば、このRT導入試していたら、loraやモデルを指定するyamlファイルに指定ディレクトリを追加したのですが、その後easywan22起動しなくなったのですが、 これってeasywan22が他にファイル指定つかってるからですか? 恐らく書き間違えはしてないと思うのですが。 近い将来easywan22本体とモデルの格納のドライブを 分離したいと考えてたので。RT抜きで解決したい。 結構そうしたい方は多いとおもうのですが?!(理由: easywan22のディレクトリ分離をしたいが、TensorRT導入で起動しなくなった)
- (105) 自己レス。 config.jsonの変更がよさそう?!ですね。 後程試してみます。
- (106) ニキはそろそろEasyシリーズ卒業の時期やと思うわ 保険としてしばらくEasywan22は残しつつ自分用のComfyUI環境を頑張って作っていった方が満足度高いで。(理由: Easyシリーズから卒業して自分用のComfyUI環境を作った方が満足度が高い)
- (111) easywan22を参考にシンプルなワークフロー作るで!って思って真似して作ってたんだけどサブグラフまであるの気づいてみた瞬間に試作ワークフローをそっと閉じた。
- (120) comfyUI 上のCボタンからテンプレ呼び出せるから t2vとかS2Vとかそのまま動くので面白いです!?
- (121) なんかcomfyUIとeasywanを切り離して考える人多いのはなんでや 単なるwan特化のスターターパックやろ。(理由: ComfyUIとeasywanは切り離して考える人が多いが、easywanはWan特化のスターターパック)
- (122) wan22 zuntanニキの新しいワークフローlora追加する項目どこいったんや?
- (123) このスレから出るとWANもcomfyUIもzuntan氏が作ったものと思ってる人大勢おるで。
- (124) 自分的には色々いれて壊したりするんで、単に別にしたかったのです。
- (125) 確かにちょくちょく見るわ、easywanに入ってる全てを氏の作品と勘違いして神のように崇めてる奴 逆に言えばそんなスーパーライト層すら呼び込むwanの魅力か。
- (126) 自分はeasy使わずにComfyUI_windows_portableで導入したわ ワークフローは他人のパクって移植+不足のカスタムノードは手動入れ 似た様なpinokioでワンボタン導入とかした事もあったけど 取り回しが限定的になるし新技術や更新に弱いから乗り換えた。(理由: pinokioは取り回しが限定的で新技術に弱いため、ComfyUI_windows_portableに乗り換え)
- (127) zuntanは違うけど その無知を利用してUIだけ作って中身も全部私が作りましたヅラする自称技術者は昔からいるし今もたくさんおるで。
- (129) ゴミyoutuberどもがeasy紹介しまくってるで。
- (135) comfyui分からんワイ「本当にそうか?」
- (136) ワイもcomfyはわからん。
- (140) comfyuiは(switchやらanything anywhereやらみたいな見ても意味わからないもんを使わなければ)分かりやすいわ。
- (142) 模範的な左から右へ作られてるフローは初心者にもわかりやすいんだけどな。
- (144) ComfyUIは他人の作ったワークフロー読み解くのが割と地獄。
- (145) 初心者が手を出しちゃいけないのは「全部入りWF」みたいな奴やな danbooruタグが使えてぇ、プロンプト補完も出来てぇ、画像生成してぇ、detailerで補正してぇ、拡大してぇ、detailerで再補正してぇ・・・みたいな膨大なWF。
- (149) hrfixとかCNとかdetailerとかwebuiやったらワンボタンでできることをわざわざ組み込んでいくストレスは中々のもの 標準forgeでできるような機能詰め込んだSDXLこれ一本!みたいなWF落ちてりゃええんやけどな。(理由: ComfyUIはwebUIのワンボタン機能に比べて組み込みがストレスフル)
- (151) ワイがつうこてる SDXL Modular Workflow は大体の事ができるで ちょい改造はしとるけど。
- (155) それがcomfyUIのバイパスなんやけどな と言いながらもワイもSD画像だけはforgeであとはcomfyUI。
- (156) やっぱ探せばあるんや url教えてクレメンス。
- (157) 落ちてるけど使いたがらんやん comfyは内部の動きが見えてしまう事もあって、自分で組めなきゃダメみたいに考えちゃう人がでちゃうんよね。(理由: ComfyUIは内部の動きが見えるため、自分で組まないとダメだと思う人が多い)
- (159) civitaiにあるで。
- (161) これか?
- (165) zuntanニキのセットは初心者には丁度いいけど フロー読み解くにはGetとSetで飛ばしまくってるから割と鬼畜難易度いう罠。(理由: zuntanニキのセットは初心者向けだが、フローが鬼畜難易度)
- (199) ComfyUIGradio2 ( github.com/asfdrwe/ComfyUIGradio2 )にWan 2.2 S2Vを追加してみたけど、 この公式のワークフローは長さ指定がスマートじゃないから、GradioのUIといまいち整合しないかんじ GradioはUI作るの楽でいいんだけど、生成AIはそもそもどういうUIがいいんだろう?(理由: GradioはUI作成が楽だが、ワークフローとの整合が悪い)
A1111/webUI関連の話題
- (130) まぁ2年前はAutomatic1111のインストール方法から始まったんやし。
- (131) 当時はA1111自体のことをStableDiffusionといってた人も結構おった記憶 いや、今もおるか。
- (146) A1111というが ForgeやReForgeもひっくるめてWebUIって呼んでるのワイだけか それ言うたらComfyUIもWebUIなんかもしれんが。
- (149) webuiやったらワンボタンでできることをわざわざ組み込んでいくストレスは中々のもの。
- (155) ワイもSD画像だけはforgeであとはcomfyUI たしかにほんまやなwebUIで通すのは錯誤の恐れがあるわ。
- (168) WebUIっていうと元々の意味はもっと広いやろね Gradio使ってるものはもちろん全部該当するやろし、WebにあるHTMLのFormも該当しそうやろし。
- (169) webuiの1つであるSDNEXTはいまいち話題に上がらンゴね。
その他のツール関連の話題(S2V, kohya HR fix, RVC, Style-Bert-VITS2, pinokioなど)
- (40) S2Vはとりあえずで動いたけど、セリフありの動画だと5秒は短い でも1020秒とか作ると高速化LoRAありでも生成時間かかりすぎて実用化きっついわとなった アニメチックな目パチ口パクだけならばAviutilかYMMでできるしってのもあるしな。(理由: S2Vは生成時間が長く実用化しにくい)
- (41) S2VというかS2Vの口パクは現状アニメ絵には全くむいとらんね。
- (42) Wan S2Vのレビューは参考になるんごんねえ サンガツやでぇ 実写系もやるから入れてもいいかなと思ってたけど色々きつそうや 別段需要あるわけでもないし見送りなや。(理由: S2Vは実写系向きだが、アニメ系でキツイため見送り)
- (43) 『「あ」の口から「い」の口へ変化』と『「お」の口から「い」の口へ変化』 実写はこれの動きが違うものだからS2Vの凄さが発揮されるけど アニメだと瞬間切り替えでその時の発音の口の形にしちゃうほうが普通だから、アニメをS2Vで口の間の動きを生成させると鬱陶しくなっちゃうのかな。
- (46) s2vはいくつかのaudio_encoders試すとあうのあるかも アニメキャラでもそれの違いで口パクするしないでてきたりするし、むしろ英語版のほうがいいときもありますね。 結構種類あるからいくつか用意したほうがいいかも。(理由: S2Vはaudio_encodersの種類を試すと合うものが見つかる)
- (47) S2V用の日本語ボイン、いや母音LoRAとかあると口の形状は合わせられそうやな。
- (48) s2v、1分超の動画も作れると聞いたけど生成が早いわけではないんか。(理由: S2Vは長時間の動画生成が可能だが、生成が速くない)
- (59) kohya HR fix使って2kポン出し派。
- (60) kohya HR fix愛用していてがAnytestの構図を完全無視するから使わなくなったで kohya HR fixは構図とかポージングが犠牲になるで。(理由: kohya HR fixは構図を無視するため使わなくなった)
- (62) コントロールネットやv-pred使うときはkohya HR fix切るよ。
- (70) RVCはボイスチャンジャーやな。ローカルでのAI音声作りは今でもStyle-Bert-VITS2やな ワイは会話モデル、エロモデル、効果音モデル(フェラ音等)の3種でやっとるよ。(理由: RVCはボイスチャンジャー、Style-Bert-VITS2はローカルAI音声作成に適する)
- (86) Style-Bert-VITS2 で調べてみるわ とりあえずゲーム全録画おわったんでいまwavにしとるとこやね。(理由: テキスト読み上げ目的でStyle-Bert-VITS2を調べる)
- (94) kohyaとかいう胴長を直すためのノートすこ。(理由: kohyaは胴長を直すために好まれる)
- (126) pinokioでワンボタン導入とかした事もあったけど 取り回しが限定的になるし新技術や更新に弱いから乗り換えた。(理由: pinokioはワンボタン導入が楽だが、取り回しが限定的で新技術に弱い)
- (147) rvcしか使ってないけど、例えば あ、 はぁ、 いく、 いや、 のみでテンプレ化するとかはどう?(理由: RVCで特定の音声をテンプレ化)
- (181) 声でNSFWはずっと考えとるけど難しくて沼やで 最近は学習しなくても5秒位の1セリフから喋らせるゼロショットTTSが流行りなんやが、もちろん再現に限界があるし。(理由: ゼロショットTTSは学習不要で流行りだが、再現に限界あり)