Stable Diffusion 3は昨日の夜にリリースされました。より強力なテキストから画像へのモデルであり、マルチテーマのプロンプト処理、画像品質、綴り能力において大幅な向上が見られます。
Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy
試用申請はこちらで受け付けています https://stability.ai/stablediffusion3
技術
Stable Diffusion 3モデルスイートのパラメータ範囲は現在800Mから8Bまで各种各样があり、ユーザーに多様なスケーラビリティと品質のオプションを提供し、さまざまな創造的なニーズに対応します。Stable Diffusion 3は、diffusion transformerアーキテクチャとflow matching技術を組み合わせています。
)。論文はhttps://arxiv.org/abs/2212.09748で確認できます。
Flow matchingに関する論文はhttps://arxiv.org/abs/2210.02747で確認できます。
効果
Prompt: studio photograph closeup of a chameleon over a black background
Prompt: Resting on the kitchen table is an embroidered cloth with the text 'good night' and an embroidered baby tiger. Next to the cloth there is a lit candle. The lighting is dim and dramatic.
対比
Prompt: cinematic photo of a red apple on a table in a classroom, on the blackboard are the words "go big or go home" written in chalk
Stable Diffusion 3
Midjourney v 6.0
Gemini Advanced / Ultra
Prompt: a painting of an astronaut riding a pig wearing a tutu holding a pink umbrella, on the ground next to the pig is a robin bird wearing a top hat, in the corner are the words "stable diffusion"
Stable Diffusion 3
Bing
Midjourney v 6.0
DALLE-3
Gemini Advanced