李飛飛ラボの空間知能への第一歩:一枚の画像から3D世界を生成

最新リリース:一枚の画像から3D世界を生成するAIシステム。この技術により、ユーザーは画像の中に「入り込み」、その世界を3Dで探検することができます。

現在のほとんどの生成型AIツールが2Dコンテンツ(画像やビデオ)しか作成できないのに対し、3D生成はより高いコントロール力と一貫性をもたらします。この能力は映画、ゲーム、シミュレーターなどのデジタルリアリティの表現方法を再定義します。

カメラエフェクト

シーンを生成した後、システムは仮想カメラを通じてリアルタイムレンダリングを行います。これにより、さまざまな芸術的な写真効果を実現できます。

浅い被写界深度のシミュレーション

特定距離にある物体に焦点を合わせ、背景をぼかす効果を作り出します。

近景遠景

ズームイン・ズームアウトのシミュレーション

カメラ位置と視野角を同時に調整することで、ユニークなダイナミックビジュアルエフェクトを実現します。

広視野狭視野


3D効果:ピクセルを超えた世界

2Dピクセルを直接生成するよりも、3Dシーンを生成する方が多くの利点があります。

  • 一度生成された世界の構造は、視点が変わることで変化しません。
  • ユーザーは生成されたシーンの中で自由に移動し、詳細を観察したり隠れたエリアを探検したりできます。
  • 世界は3D物理則に従っており、しっかりとした奥行き感を提供します。

奥行き

奥行き

シーン

  • ソナー
  • スポットライト
  • 波紋

さらに、シーンをダイナミックに表示させることができます。

  • 微風
  • 色彩の揺れ

古典絵画の中へ歩み込む

3D生成技術は、クラシックアートを全く新しい方法で体験できるようにします。以下は、ゴッホ、ホップ、スーラ、カンディンスキーの絵画から生成された世界です。描かれていない部分はすべてAIによって補完されています。


クリエイティブワークフロー

3Dワールド生成は他のAIツールと自然に協力でき、クリエイターに新しい表現方法を提供します。例えば、テキストから画像を生成した後、それをさらに3Dワールドに拡張できます。異なる生成モデルはシーンに独自のスタイルを与えます。

以下の例は、同じテキストプロンプトに基づく異なる生成モデルのシーンです。

A vibrant cartoon-style teenager's bedroom with a bed covered in colorful blankets, a cluttered desk with a computer, posters on the walls, and scattered sports gear. A guitar leans against the wall, and a cozy, patterned rug is in the center. Light from a window adds a warm, youthful vibe to the room.

World Labsについて

World Labsは、「空間知能」AIを開発することを目指す企業です。私たちは大規模なワールドモデル(LWMs)を構築し、AIを2次元ピクセルから完全な3D仮想および現実世界へと進化させ、人間に近い空間知能を持たせます。この会社はAI分野のリーダーである李飛飛博士、ジャスティン・ジョンソン、クリストフ・ラスナー、ベン・ミルデンホールによって共同設立され、チームにはコンピュータビジョンとグラフィックス分野のトップクラスの人材が集結しています。

World Labsは、空間知能AIの新しい時代を切り開きます。人類の知能の核心の一つは空間知能です。空間知能は私たちが周囲の世界を理解し、それに対応する能力を与えてくれます。砂城を作るから超高層ビル都市を設計するまで、創造と推論はこれに依存しています。そして言語知能が生成型AIの初期革命を牽引したように、今私たちはさらに高次元へと進み、AIに空間知能を付与し、3D世界における物体、場所、相互作用を理解させる時代を迎えています。