『State of AI Report 2024』(5)- マルチモーダル関連

ハリウッドレベルの制作がビジュアルエフェクトに生成型AIを導入開始

視覚効果はコストがかかり、労働集約的なビジネスであるため、ハリウッドのプロデューサーたちは段階的に生成型AIの導入を試みています。ただし、これはアーティストやアニメーターたちからかなりの反発を引き起こしています。現在、多くの関連作業はまだ裏で静かに行われている段階ですが、注意深い視聴者はすでにHBOやNetflixの作品の中で、生成型AIによる背景の欠陥をいくつか見つけ出しています。これは、物理的および幾何学的特性を安定かつ正確に表現することが難しいという、生成モデルが長年抱える問題と密接に関係しています。

昨日、ポーラは私にハリウッドがどのようにAI技術を受け入れているかについてのビデオを送ってくれました。先月には、『アバター』の監督ジェームズ・キャメロンが正式にStability AIの取締役会に参加しました。

生成型AIによる視覚効果が専門化へと進む

画期的なコラボレーションとして、Runwayは映画・ゲームスタジオのライオンズゲート(『ジョン・ウィック』、『トワイライト・サガ』、『ハンガー・ゲームズ』シリーズなどで知られる)と提携しました。Runwayは、ライオンズゲートの2万本もの作品カタログに基づいて新しい生成モデルを開発します。一方、ライオンズゲートは「コスト効率の高いコンテンツ創作機会」をサポートするためにRunwayのモデルを使用すると述べています。現時点では、この取引の財務詳細は明らかにされていませんが、ライオンズゲートは当初このモデルをストーリーボード設計に使用し、その後視覚効果の制作にも段階的に利用していく予定です。

Runwayの話題が出ましたが、先日Apple Vision Proとの統合を示すビデオを見ました。非常にクールでした。

主要な研究所が分かれ、実力のある挑戦者が台頭

科学的意見の相違、商業的圧力、個性の衝突、そして資本の可用性により、ますます多くの小さな研究チームが大規模な研究所から分離しており、これによりエコシステムがさらに深化しています。

日本のSakana AIはそのような新興勢力の一つで、『Attention Is All You Need』の唯一Googleで働く著者であるLlion JonesとDavid Haによって設立され、つい最近3000万ドルのシード資金調達を完了しました。Sakana AIは「モデル結合」の進化的手法に焦点を当てており、既存のモデルを組み合わせて最も有望なモデルを選別し、次世代モデルの「親」として使用します。

Sakana AIは日本国内の企業の中でもユニコーンになるのが最も早いと考えられています。transformerの作者であるLlion Jonesは特に日本が好きで、必ず日本で働き、生活したいと考えていると言われています。

パリに本社を置くH社は、豊富な経験を持つ複数のDeepMind研究員によって設立され、最近2億2000万ドルの資金調達を完了しました。同社はロボットプロセス自動化(RPA)向けのアクションモデルを開発することを目指しています。また、OpenAIの取締役会内で紛争が発生したことを受けて、共同創始者のIlya SutskeverはSafe Superintelligence Inc.を設立し、短期的な商業目標やプレッシャーを持たず、安全なAGIの構築に特化した新しい研究所を立ち上げました。

最近、元Stable Diffusion開発者の一部がBlack Forest Labsを設立し、画像と動画生成に注力しています。彼らは最初のオープンソース画像モデルシリーズFLUX.1をすでに公開しており、その品質は急速にMidjourneyと競争するレベルに達しています。(以前Fluxを紹介しましたが、本当に素晴らしいものです!)

しかし、優れたエンジニアが必ずしも優れた起業家になるとは限りません。大規模研究所から独立したチームの中には初期段階で成功したものもあれば、そうでないものもあります。Safe Sign Technologiesの創業チームは、1人の元弁護士と1人の元DeepMind研究員で構成され、外部投資家への株式希薄化なしに買収を成功させました。一方で、H社は一グループの元DeepMind従業員によって設立され、2億ドル以上の資金調達を行いましたが、製品のリリース前にチームの完全性を維持できず、最終的にチームが解散しました。