バイトダン AI 画像編集ツール SeedEdit

今月11日、バイトダンスはSeedEditを発表しました。これは大規模な拡散モデルに基づく画像編集ツールで、任意のテキストプロンプトに基づいて画像を変更することができます。

公式の効果


方法

画像編集における主要な課題はペア画像データの希少性にあります。この問題に対処するために、SeedEditはテキストから画像生成(T2I)モデルを弱い編集モデルとして捉え、新しいプロンプトによって完全な新画像を生成することで「編集」を行います。その上で、これを抽出・整列し、画像条件付きの編集モデルに変換します。SeedEditは効率的な編集データ生成とフィルタリング戦略を提案しており、これにより任意のT2Iモデルを強力な画像エディターに調整することができます。さらに、SeedEditは編集命令を正確に解釈し、画像を生成するための新しい編集アーキテクチャを設計しました。Seed T2Iベースモデルに基づき、SeedEditは安定した高品質の美しさを持つ画像編集効果を実現しています。画質を損なうことなく無限回の編集命令を実行でき、ユーザーに高品質な編集体験を提供します。

アーキテクチャ

SeedEditは因果拡散モデル(Causal Diffusion Model)を導入し、画像から画像への生成を行っています。このモデルは双方向構造を採用しており、それぞれが入力画像と出力画像/テキストを処理します。これらの2つのブランチはパラメータを共有しており、効率的な協調最適化と生成を実現しています。

比較





試用

試用リンク🔗:https://huggingface.co/spaces/ByteDance/SeedEdit-APP

まだ使用できていません。445人待ちで、毎回待っている間にネットワークが切断されてしまいます。また、スペースのコピーもあまりサポートされておらず、APP_KEYとSECRET_KEYが必要です。そのため、効果については想像でしか確認できません。