Stable Diffusion 3がリリースされました

Stable Diffusion 3は昨日の夜にリリースされました。より強力なテキストから画像へのモデルであり、マルチテーマのプロンプト処理、画像品質、綴り能力において大幅な向上が見られます。

Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy

試用申請はこちらで受け付けています https://stability.ai/stablediffusion3

技術

Stable Diffusion 3モデルスイートのパラメータ範囲は現在800Mから8Bまで各种各样があり、ユーザーに多様なスケーラビリティと品質のオプションを提供し、さまざまな創造的なニーズに対応します。Stable Diffusion 3は、diffusion transformerアーキテクチャとflow matching技術を組み合わせています。

)。論文はhttps://arxiv.org/abs/2212.09748で確認できます。

Flow matchingに関する論文はhttps://arxiv.org/abs/2210.02747で確認できます。

効果

Prompt: studio photograph closeup of a chameleon over a black background


Prompt: Resting on the kitchen table is an embroidered cloth with the text 'good night' and an embroidered baby tiger. Next to the cloth there is a lit candle. The lighting is dim and dramatic.

対比

Prompt: cinematic photo of a red apple on a table in a classroom, on the blackboard are the words "go big or go home" written in chalk

Stable Diffusion 3

Midjourney v 6.0

Gemini Advanced / Ultra

Prompt: a painting of an astronaut riding a pig wearing a tutu holding a pink umbrella, on the ground next to the pig is a robin bird wearing a top hat, in the corner are the words "stable diffusion"

Stable Diffusion 3

Bing

Midjourney v 6.0

DALLE-3

Gemini Advanced