Irodoriの新バージョンきてた
サンプル聞く限り音質改善がメイン?
https://huggingface.co/Aratako/Irodori-TTS-500M-v2
LTX2.3を超えて日本語にも対応していると触れ込みのdaVinci-MagiHumanがリリースされたらしい
https://www.reddit.com/r/StableDiffusion/comments/1s2b2qt/davincimagihuman_this_new_opensource_video_model/
https://huggingface.co/GAIR/daVinci-MagiHuman
ID-LoRA
簡単に音声クローニング+リップシンクできていいね
https://huggingface.co/RuneXX/LTX-2.3-Workflows/discussions/59
でも日本語のイントネーションや感情表現は相変わらずだわ
餅は餅屋でqwen-ttsやirodoriにまかせるしかないか…
線と塗りの境界の部分がなんか白っぽくなる気がしたからVAEも学習させてみたやで。
明確に彩度の上がるSDXL/IL用と比べて変化が少ないやが、よければ使ってみてや。
https://civitai.com/models/2487530
>>903
このloraマイナスで適用したら抑えられんかな
https://civitai.com/models/1581186/bouncing-breasts-xl?modelVersionId=2595899