画像編集モデルFireRed-Image-Edit-1.1

初めに

FireRed‑Image‑Edit‑1.1 は、最新のオープンソース画像編集モデルで、人物の顔の一貫性・多要素合成・テキスト編集・古写真修復・メイク編集など、10種類の高度な編集機能を備えた現時点で最強クラスのオープンソース画像編集モデルです。

🔥 FireRed‑Image‑Edit‑1.1とは

  • Diffusion Transformer(DiT) をベースにした指示駆動型(Instruction‑Following)画像編集モデル
  • 中国語・英語バイリンガル対応
  • 最大3枚の参照画像を使ったマルチ画像編集
  • Apache‑2.0ライセンスで商用利用可能
  • ImgEdit / GEdit / REDEdit ベンチマークでオープンソースSOTA(最高性能)を達成

⭐ バージョン1.1で強化されたポイント

  • 顔の一貫性が大幅向上(Differentiable Consistency Loss)
  • 多要素融合(人物+背景+スタイルなど)の精度向上
  • スタイル付きテキスト編集の忠実度アップ
  • メイクアップ編集が新規追加
  • マルチ画像合成の安定性向上

🧩 FireRed‑Image‑Edit‑1.1 の10種類の編集機能

  • 追加 — 新しい物体・要素を自然に追加
  • 調整 — 色・光・表情などを変更
  • 置換 — 特定オブジェクトを別のものに入れ替え
  • 削除 — 不要物をインペインティングで除去
  • 背景 — 被写体を保持したまま背景変更
  • スタイル変換 — アニメ・油絵などのアートスタイル
  • テキスト編集 — フォント・照明・遠近法を保持したまま文字変更
  • 修復 — 古写真の傷・退色を修復
  • マルチ画像編集 — 最大3枚の参照画像を合成
  • バーチャル試着 — 服装を自然に着せ替え
    firered-image.com

⚙️ 技術的特徴

  • Diffusion Transformer + Qwen2.5‑VL による高精度理解
  • 自動クロップ&合成エージェントで複雑な編集も簡単
  • LoRAエコシステムでカスタムスタイル学習も可能
  • 高速化(量子化・蒸留・静的コンパイル)により
    30GB VRAMで4.5秒生成も実現
    Hugging Face

🖥️ ComfyUIでの利用

ComfyUIでは以下を配置するだけで利用可能:

  • FireRed‑Image‑Edit‑1.1‑transformer
  • Qwen Image VAE
  • Qwen2.5‑VL 7B
  • Lightning LoRA(高速モード)

ワークフロー

ComfyUI

Posted by eightban