eightban's memo

残しておきたい記事をまとめてみました。このブログに書いてあるドキュメントやブログで配布しているファイルの使用によって発生するいかなる損害に対してもこのブログの管理者は責任を負いません。使用する場合は自己責任のもとに使用してください。

画像編集モデルFireRed-Image-Edit-1.1

2026年6月2日

初めに

FireRed‑Image‑Edit‑1.1 は、最新のオープンソース画像編集モデルで、人物の顔の一貫性・多要素合成・テキスト編集・古写真修復・メイク編集など、10種類の高度な編集機能を備えた現時点で最強クラスのオープンソース画像編集モデルです。

🔥 FireRed‑Image‑Edit‑1.1とは

Diffusion Transformer（DiT） をベースにした指示駆動型（Instruction‑Following）画像編集モデル
中国語・英語バイリンガル対応
最大3枚の参照画像を使ったマルチ画像編集
Apache‑2.0ライセンスで商用利用可能
ImgEdit / GEdit / REDEdit ベンチマークでオープンソースSOTA（最高性能）を達成

⭐ バージョン1.1で強化されたポイント

顔の一貫性が大幅向上（Differentiable Consistency Loss）
多要素融合（人物＋背景＋スタイルなど）の精度向上
スタイル付きテキスト編集の忠実度アップ
メイクアップ編集が新規追加
マルチ画像合成の安定性向上

🧩 FireRed‑Image‑Edit‑1.1 の10種類の編集機能

追加 — 新しい物体・要素を自然に追加
調整 — 色・光・表情などを変更
置換 — 特定オブジェクトを別のものに入れ替え
削除 — 不要物をインペインティングで除去
背景 — 被写体を保持したまま背景変更
スタイル変換 — アニメ・油絵などのアートスタイル
テキスト編集 — フォント・照明・遠近法を保持したまま文字変更
修復 — 古写真の傷・退色を修復
マルチ画像編集 — 最大3枚の参照画像を合成
バーチャル試着 — 服装を自然に着せ替え
firered-image.com

⚙️ 技術的特徴

Diffusion Transformer + Qwen2.5‑VL による高精度理解
自動クロップ＆合成エージェントで複雑な編集も簡単
LoRAエコシステムでカスタムスタイル学習も可能
高速化（量子化・蒸留・静的コンパイル）により
30GB VRAMで4.5秒生成も実現
Hugging Face

🖥️ ComfyUIでの利用

ComfyUIでは以下を配置するだけで利用可能：

FireRed‑Image‑Edit‑1.1‑transformer
Qwen Image VAE
Qwen2.5‑VL 7B
Lightning LoRA（高速モード）

ワークフロー

画像編集モデルFireRed-Image-Edit-1.1

Posted by eightban

好きな場所で分割できる画像分割ツールバッチ処理対応

ディスカッション

コメント一覧

まだ、コメントがありません

コメントをどうぞコメントをキャンセル

この記事のトラックバックURL