2023年に比較的重要な15のモデルは以下の通りです:
:Anthropicによって公開され、これが最初に公開された大規模言語モデル(LLM)です。AnthropicはOpenAIの主要な競合相手であり、Claudeモデルはできるだけ有用で、誠実かつ無害であるように設計されています。
:GPT-3を基盤にしたOpenAIによるGPT-4は、その性能が複数のベンチマークテストで人間を超えるほどであり、これまでで最も強力なLLMの一つです。
:Stability AIのアップデート版テキストから画像への変換モデルで、より高解像度で品質の優れた画像を生成可能。
:Metaによって開発され、このAIモデルはゼロショット汎化を通じて画像内のオブジェクトを分離することができます。
:Metaはそのフラグシップ大規模言語モデルを更新し、オープンソース版のLlama 2を発表しました。その较小なバリアント(7Bと13B)は相対的に小さいサイズながらも高性能を提供します。
:OpenAIは、テキストから視覚的なコンテンツを生成するモデルDALL-Eの改良版であるDALL-E 3をリリースしました。以前に共有した内容:《
:GoogleとDeepMindが共同で開発したこのツールは、AIが生成した音楽や画像に透かしを付与します。この透かしは画像が変更された後でも検出可能です。これはかなり興味深いですね、後で詳しく見てみましょう。
:フランスのAI企業Mistralによって公開されました。このコンパクトな70億パラメータモデルは、性能においてLlama 2の13Bバージョンを超えており、同等規模のモデルの中でトップに位置しています。
:百度という多国籍の中国テクノロジー企業は、Ernie 4.0を発表しました。これはこれまでに登場した中で最も優れた中国の大規模言語モデルの一つです。
:OpenAIは、アップデートされた大規模言語モデルGPT-4 Turboを発表しました。このモデルは128Kのコンテキストウィンドウを持ち、価格が引き下げられています。
:OpenAIは、オープンソースの音声認識モデルWhisper v3を発表しました。このモデルは、高い精度と拡張された言語サポートで知られています。
:Anthropicは最新の大型言語モデルClaude 2.1を発表しました。このモデルは業界をリードする200Kのコンテキストウィンドウを備えており、長編の文学作品などの広範なコンテンツを処理する能力が向上しています。以前に共有した内容:《
:DeepMindのムスタファ・スレイマンによって設立された新興企業Inflectionは、その第二の大型言語モデルInflection-2を発表しました。この発表は、LLM分野における競争の激化を示しています。
:Googleが発表したGeminiはGPT-4の強力な競合相手となり、その一つの変種であるGemini Ultraは複数のベンチマークテストでGPT-4を上回る性能を示しました。以前に共有した《
:Midjourneyは最新版のテキストから画像へのモデルをリリースし、より直感的なプロンプトと最適化された画像品質により、ユーザー体験を向上させました。以前に共有した《
近年、人工知能システムは複数のタスクにおいて人間の基準レベルに対して顕著な進歩を遂げています。これらのタスクには9つのAIベンチマークテストが含まれ、例えば画像分類や基本的なリーディング理解などが挙げられます。
具体的には、AIは次のいくつかの領域で人間の基準を超える成果を上げています:
分野で初めて人間を超えるレベルに達する; タスクでリードを取る; 分野で突破を遂げる; タスクで人間を超えた。
(コンテストレベルの数学問題)。
私たち人類はまだ完全には追い越されていません 🐶。