以下は、提供された5chログ(841〜999)から、指定された生成AIの「モデル」に関する話題をすべて抽出したものです。抽出の基準は以下の通りです:
- 対象モデル:NovelAI v4もしくはv3 (NAI), Pony, illustrious 0.1,1.0,1.1,2,3,3.5vpred (イラストリアス, リアス,ill), Noobai, FLUX, HiDream, Wan2.1 (wan), FramePack。
- ログ内でこれらのモデル名(またはその略称・派生形)が明示的に言及されている部分を抽出。
- 特に、モデルが選ばれている理由(例: 性能の向上、軽さ、生成品質など)が述べられている場合、それを明記。
- 抽出はログのレス番号順に整理。重複や文脈のつながりを考慮し、関連する連続レスをまとめて記述。
- 対象外のモデル(例: 一般的なSDXLやggufのクオリティ比較)は抽出せず、指定モデルに限定。
- ログ全体で、NovelAI, Pony, Noobai, HiDream, FramePackの言及は見つかりませんでした。主にWan関連とillustrious関連が抽出されました。
抽出結果
Wan関連(Wan2.1, Wan2.2, EasyWan22など)
- 864: EasyWan22を入れる結果になった。当たり前だがあっさり動いた。ただしStartImageとEndImageを同じにしても一回転はしてくれなかった。
- 選ばれている理由: あっさり動いたため(導入のしやすさ)。
- 865: 2.1時代には全然うまくいかなかった転んでだばーが2.2でちょっとだけできるようになっている。受け身もばっちり。
- 選ばれている理由: 2.1から2.2への進化で、特定の動作(転んでだばー、受け身)が改善されたため。
- 877: 新時代来たか。でも、これはホントに良く出来ててWanの凄さがわかるね。まばたきとか胴体のくねる動きで破綻しないとかさ。
- 選ばれている理由: まばたきや胴体のくねる動きで破綻しないなど、生成の安定性が高いため。
- 878: Wan2.1から2.2の進化はホント凄いよな。生成動画の画質(品質)が向上、被写体の一貫性保持能力が向上、多彩なアニメーションが可能に。一番びびるのはWan2.1より生成処理が軽くなった。これだわ。魔法かよ。
- 選ばれている理由: 画質向上、一貫性保持、多彩なアニメーションが可能、生成処理が軽くなった(特に2.1比で軽量化が魔法級)。
- 880: Wan2.2、解像度640ならワイのSandy自作機メモリ32GB 4060Ti 16GBでメインメモリもVRAMも溢れることなく生成できるのでしゅごい。目下の問題は動画プロンプトの書き方がさっぱりわからんことだ。
- 選ばれている理由: 低スペック(Sandy自作機、メモリ32GB, 4060Ti 16GB)でもメインメモリ/VRAMが溢れずに生成可能(軽さと互換性の高さ)。
- 890: Wan2.2-Fun-14Bてのも出たみたいやな。controlnetみたいな感じらしいけど、やっぱ重いんやろか。
- 選ばれている理由: controlnetみたいな機能がある(ただし重い可能性を懸念)。
- 891: wan2.2GGUFモデルとlight2vでメインメモリ53Gいくんだけど俺何か間違ってる?
- 892: wan2.2GGUFモデルとlight2vでメインメモリ53Gいくんだけど俺何か間違ってる?
- 893, 894: (892の続き) そんなもんやない?ワイ環やと生成中のメインメモリ69GBくらい行ってるで。
- 選ばれている理由: なし(主にメモリ使用量の議論)。
- 928: ここで、前に紹介されてたvaeとかエンコーダー内蔵のwan2.2のgguf削除してしまったのですが、覚えてるかたいます?
- 選ばれている理由: vaeやエンコーダー内蔵のため(便利さ)。
- 946: チャッピー5にwan2.2用にプロンプト書いてくれと頼んだら、時間指定でプロンプトだしてきた。wanに時間指定できないといったら別の作ってきたんだけど、もしやと思って、時間指定のプロンプトいれてみたら!?普通のプロンプトに変換されてしまった。
- 選ばれている理由: なし(プロンプト生成のテスト)。
- 953: DDR5の128GBでeasywan22の仕上げしてて消費量105GBまで行ったのは見た。
- 954: (864の続き) StartImageとEndImageを同じにしているのに一回転しない理由がわかったで。ワークフローをよくよく見たら、EndImageを使うかどうかを切り替えるUseEndImageノードがEndImaegの右にあった。これをオンにしたらEndImageノードが半透明でなくなった。そういうことなんやねえ。で無事に一回転できた。お騒がせしたで。
- 選ばれている理由: なし(ワークフローの調整例)。
- 962: wan2.2のぶっかけLoRAをアップしたで(projectile_cum)。やや試行錯誤感あるけどここはまあさっさとリリースや。lowのLoRAはこれいる?感もあったりやたら穴に突っ込みがちだったりとピーキーやがよかったら使ってみてな。使い勝手の感想も待ってるで。
- 選ばれている理由: なし(LoRAのアップロードと感想募集)。
illustrious関連(イラストリアス, リアス, ill, illustriousXL3.6など)
- 938: 今は動画で盛り上がってるから薄れがちだけどpixaiのTsubaki凄いな。動画にも元絵は必要だしローカルもイラリからそろそろ進化が欲しいところ。
- 選ばれている理由: 動画生成に元絵が必要なため、イラリ(illustrious)の進化を望む(ローカル環境での進化欲求)。
- 939: tsubakiはリアスから蒸留したパチモンみたいなもんやろ。
- 選ばれている理由: なし(tsubakiがリアス=illustriousから蒸留した派生モデルである点の指摘)。
- 941: illustriousXL3.6はSDXLベースなのに自然言語で左右のかき分けがほぼほぼ完璧にできるで。問題はSDXLでありながらローカルには落ちてこん点やけどな。
- 選ばれている理由: SDXLベースなのに自然言語で左右のかき分けがほぼ完璧(自然言語対応の精度の高さ)。ただしローカル落ちてこないのが問題。
- 943: (941の続き) illustriousXL3.6はSDXLベースなのに自然言語で左右のかき分けがほぼほぼ完璧にできるで。問題はSDXLでありながらローカルには落ちてこん点やけどな。
- 選ばれている理由: 同上(自然言語対応の精度の高さ)。
FLUX関連
- 902: FP8タイプのモデルはよく見かけるんやがFP4のモデルはFLUXでちょっと見た程度やな。FP4は全然流行らんなRTX5000シリーズの売りの1つだったはず何やが。
- 選ばれている理由: なし(FP4モデルとしてFLUXで少し見た程度で、流行っていない点の指摘)。
- 903: fp4は精度低過ぎてggufのQ2使った方が圧倒的にマシってredditでよく見る。
- 選ばれている理由: なし(FP4の精度が低く、gguf Q2の方がマシというredditの意見。FLUXの文脈で関連)。
追加の考察
- 全体の傾向: Wan関連の言及が最も多く、2.1から2.2への進化(軽量化、品質向上、一貫性)が頻繁に理由として挙げられています。illustrious関連は自然言語対応の精度が強みとして抽出されました。FLUXはFP4の文脈で少し触れられるのみで、理由は薄め。
- 抽出漏れの確認: ログを複数回確認しましたが、指定外のモデル(例: ChatGPT関連の一般論)や曖昧な言及は除外。NovelAI, Pony, Noobai, HiDream, FramePackの言及はゼロでした。
- 不明点: もし抽出の基準や追加の文脈が必要でしたら、教えてください。
—以下は、提供された5chのログから、生成AIの「モデル」に関する話題を抽出したものです。抽出の基準は以下の通りです:
- 生成AIのモデル(主に画像/動画生成モデルやLLMなど)に関する言及を中心に抽出。
- 指定された除外モデル一覧(NovelAI v4/v3 (NAI)、Pony、illustrious 0.1/1.0/1.1/2/3/3.5vpred (イラストリアス/リアス/ill)、Noobai、FLUX/HiDream、Wan2.1 (wan)、FramePack)は除外。なお、Wan2.2は除外リストに含まれていないため抽出対象としました。
- 特に、そのモデルが選ばれている理由(例: 進化の凄さ、性能比較、用途の適性など)が明記されている場合、それを強調して抽出。
- ログのレス番号を参考に、関連する内容をまとめ、冗長さを避けて整理。重複する話題は統合。
1. Wan2.2関連モデル
- Wan2.2: 2.1時代に比べて転んでだばー(転倒などの動作)が少しできるようになった(レス865)。進化が凄いと評価されており、生成動画の画質向上、被写体の一貫性保持能力向上、多彩なアニメーションが可能になった点が挙げられる。特に、生成処理が軽くなったのが驚異的で「魔法かよ」との声(レス878)。開始画像の要素を異なるシーンに持っていける点がすごい(レス879)。解像度640でSandy自作機(メモリ32GB、4060Ti 16GB)でも生成可能(レス880)。動画プロンプトの書き方が難しいため、LLMに丸投げする提案あり(レス881)。時間指定プロンプトを試すと普通のプロンプトに変換される挙動(レス946)。
- 選ばれている理由: 2.1からの大幅進化(品質・一貫性・軽量化)が主な魅力。被写体の一貫性やアニメーションの多様性が強みで、公式VACEの期待も(レス879)。
- EasyWan22: 導入するとあっさり動いた(レス864)。続き生成でStartImageとEndImageを同じにしても一回転しない問題を解決(UseEndImageノードのオンで対応)(レス954)。仕上げでDDR5 128GB使用時に消費量105GB(レス953)。
- 選ばれている理由: 環境再整理の理想として、PythonとComfyUIをセットで新規作成可能。混乱を避けるための選択(レス859)。
- Wan2.2-Fun-14B: controlnetみたいな感じで登場。重い可能性あり(レス890)。
- 選ばれている理由: controlnetのような機能が期待され、新規性が高い。
- wan2.2GGUFモデル: light2vと組み合わせでメインメモリ53GB使用(レス892)。生成中メインメモリ69GBや80GB程度(レス893-894)。VAEやエンコーダー内蔵のものを削除してしまったとの相談(レス928)。
- 選ばれている理由: メモリ使用のバランスが取れており、生成時の安定性が高い。設定次第でVRAM/メインメモリの調整が可能(レス893)。
2. FP/gguf関連モデル(量子化モデル)
- fp16, gguf Q8, fp6: 生成クオリティの比較でfp16 > gguf Q8 > fp6と評価(レス910)。
- 選ばれている理由: fp16が最高品質だが、重さのトレードオフでgguf Q8がバランス良い選択。
- ggufのQ2/Q4_K_M: fp4は精度が低すぎてggufのQ2の方がマシ(レス903)。Q4_K_Mが容量:性能比で一番良いバランス(レス911)。ただし、モデルデータごとに最適が異なり、バランス思考は分野による(レス912-913)。
- 選ばれている理由: 言語モデルではQ4_K_Mのバランスがコスパ良いが、画像生成では上位モデル(fp16など)の品質を優先すべきとの指摘。PCスペックごとに最適化が必要(レス912)。
- FP8/FP4タイプ: FP8はよく見かけるが、FP4は実用性なく流行らない。fp8でもfp16比で劣化を感じる(レス902,905-907)。RTX5000シリーズの売りだったが、精度不足(レス906)。
- 選ばれている理由: FP8はfp16の劣化版として使われるが、FP4はクオリティ低すぎて避けられる。ggufの方がマシ(レス903)。
3. その他の画像/動画生成モデル
- pixaiのTsubaki: 凄いと評価。動画の元絵としても必要で、ローカル進化の期待(レス938)。ただし、リアス(除外)から蒸留したパチモン(レス939)。非SDXLで自然言語対応、複数キャラ対応(レス941)。
- 選ばれている理由: 独自性を強調するが、リアスベースのため蒸留モデルとして選ばれる。自然言語と複数キャラの対応が強み。
- illustriousXL3.6: SDXLベースなのに自然言語で左右のかき分けがほぼ完璧(レス943)。問題はローカルに落ちてこない点。
- 選ばれている理由: SDXLでありながら自然言語の精度が高いのが魅力。左右かき分けの完璧さが選定ポイント。
4. LLM(Large Language Model)関連
- ChatGPT (特にGPT-5/o1?アップグレード版): アップデートで画像生成が遅くなったが、トラフィック2倍でサーバーキツイ(レス924-927,931,933-934)。エロが通りやすくなったがリクエスト制限がダルい(レス952)。角度変え指示が通らない(レス933)。プログラミング用途でClaude > Gemini > GPT(レス976)。NSFWプロンプト出力可能だが調教必要(レス975)。イラスト生成で温かみのある出力(レス977-979,981)。性能比較でClaudeとトップ争い(レス970)。
- 選ばれている理由: 画像生成の出来が良く、既存イラストレーターを脅かすレベル(レス966)。エロプロンプトやwan2.2用プロンプト生成に便利(レス946,952)。課金次第で便利だが、コンテクストサイズ減少の懸念(レス983)。
- Gemini: プログラミング用途でClaudeに次ぐ。ヲタクに理解あり(レス968)。課金有りで画像/動画生成が頭一つ抜けている(レス983)。無料CLI併用(レス974)。NSFWプロンプト出力可能(レス975)。小説勢向け1択(レス972)。
- 選ばれている理由: エンタメ用途でお得(画像/動画生成可能)(レス986)。課金3000円程度で一番便利(レス983)。セカンドオピニオンとして無料版が強い(レス969,971)。
- Grok: 結構動く(レス963)。ヲタクに理解あり(レス968)。画像面でChatGPTと同等、3日前に追従(レス983)。NSFWプロンプト出力可能(レス975)。性能でお話にならないレベルとの評価も(レス970)。
- 選ばれている理由: 無料でセカンドオピニオンに便利(レス971)。画像生成の追従が最近の強み。
- Claude: プログラミング用途でトップ(レス976)。課金でCode使用(レス974)。トップ争い(レス970)。
- 選ばれている理由: プログラミングの得意分野で圧倒的。無料枠Geminiとの併用が理想(レス974)。
- gpt-oss-20b: LMStudioからMCPサーバー経由でローカルPCのファイル読み書き可能。性能評価中(レス974)。
- 選ばれている理由: ローカルLLMとしてNSFWプロンプト用途に選択(レス973-974)。
- その他LLM全般: NSFWプロンプトはローカルLLM以外選択肢少ない(レス973)。得手不得手あり、セカンドオピニオン前提(レス969)。全体性能でChatGPT上位(レス967)。
これらの抽出は、ログの文脈を基にモデル名と関連議論をピックアップしたものです。ログ全体がComfyUIやWan関連の議論が多いため、Wan2.2が中心となりました。除外モデルに関する言及(例: FLUX in 902、リアス in 939-941)はスキップしています。追加のログや詳細なフィルタリングが必要であれば、教えてください。