先週、AIスタートアップのブラックフォレストラボは会社設立と初のテキストから画像を生成するAIモデルスイート「FLUX.1」のリリースを発表しました。このドイツの企業は、Stable Diffusion技術を開発し、潜在拡散(latent diffusion)技術を発明した研究者たちによって設立され、画像やビデオ用の最先端の生成型AI技術の提供を目指しています。
replicate で使用可能です:https://replicate.com/black-forest-labs/flux-pro
FLUX.1 のリリースは、6月中旬に Stability AI が発表した議論を呼んだ Stable Diffusion 3 Medium から約7週間後のことです。Stability AI の製品は、人間の解剖学的表現において不十分であるとして、画像合成愛好家たちから広範な批判を受けました。ユーザーたちは、多くの肢体や身体が歪んでしまう例をソーシャルメディア上で共有しました。問題の多いリリースの前に、Stability AI の主要なエンジニア3名、Robin Rombach、Andreas Blattmann、Dominik Lorenz が退職し、その後彼らは潜在拡散技術の共同開発者である Patrick Esser や他のメンバーと共に Black Forest Labs を設立しました。
FLUX.1 には3種類の異なるバージョンが提供されます:
FLUX.1 [pro]
FLUX.1 の最上位版で、最先端の画像生成性能を提供します。優れたプロンプト追随能力、視覚品質、画像の詳細、出力の多様性を持っています。API 内での FLUX.1 [pro] の推論計算能力を段階的に向上させています。さらに、FLUX.1 [pro] は Replicate と fal.ai からアクセス可能です。チームはまた、企業向けのカスタマイズされたソリューションも提供しています(お金を稼ぐためにね lol)。
FLUX.1 [dev]
FLUX.1 [dev] は、非商業用途向けのオープンウェイトのガイド付きディスティレーションモデルです。これは直接 FLUX.1 [pro] からディスティルされており、FLUX.1 [dev] は同等の品質とプロンプトへの従属性を持ちながら、同じサイズの標準モデルよりも効率的です。FLUX.1 [dev] のウェイトは Hugging Face で利用可能であり、Replicate や fal.ai で直接試すことができます。商業用途については、チームに別途連絡してください。
FLUX.1 [schnell]
最速のモデルで、ローカル開発および個人使用を目的として設計されています。FLUX.1 [schnell] は公開されており、Apache2.0 ライセンスに従っています。FLUX.1 [dev] と同様に、そのウェイトは Hugging Face で利用可能であり、推論コードは GitHub で見つけることができます。また、FLUX.1 [schnell] は Replicate と fal.ai 経由でも使用可能です。(オープンソースでコミュニティを育て、ユーザーを引き寄せます)