ChatGPT 4.5 発表:より強力、より自然、あなたをより理解

OpenAIは最近、史上最強のGPTバージョンを発表しました——GPT-4.5現在、研究プレビュー形式で世界中のProユーザーと開発者に公開されています。

GPT-4.5は、前世代モデルに基づき、事前学習と後学習の規模をさらに強化し、無教師学習能力の拡張により、パターンの識別や関連性の理解が得意で、より創造的な生成能力を持っています。

早期テストによると、GPT-4.5は会話体験において明らかに自然でスムーズです。幅広い知識基盤、ユーザーや意図の正確な理解、そして高い「感情知能(EQ)」により、執筆、プログラミング、および現実生活における具体的な問題解決をより効果的に支援できます。

無教師学習の規模化における突破

OpenAIは、AI能力を向上させるために、補完的な2つの人工知能訓練パラダイムを拡張しました。それは無教師学習推論能力です。この2つのパラダイムは知能の2つの次元を構成します。

推論能力の拡張モデルに質問に答える前に「考える」ことと完全な推論チェーンを形成させることで、AIが複雑な科学、技術、工学、数学(STEM)および論理問題を解決できるようにしています。OpenAIのo1そしてo3-miniモデルはこのパラダイムの代表例です。

GPT-4.5無教師学習の規模化のパラダイムを代表しています。計算リソースとデータ規模を大幅に増やし、同時にアーキテクチャと最適化手法の革新を組み合わせることで、GPT-4.5は世界に対する認識の精度を高め、より深い直感的理解を実現しました。

GPT-4.5はマイクロソフト Azure AIスーパーコンピュータ上でトレーニングされ、その結果、モデルは各分野でより広範な知識基盤と深く洗練された世界理解力を備え、幻覚問題を効果的に削減し、幅広い使用シーンでより高い信頼性を示しました。

より深い、より広範な知識基盤

SimpleQA大規模言語モデル(LLM)の知識正確性を評価するための方法であり、一連のシンプルながらも挑戦的な知識質問を通じて、AIモデルがリアルワールド情報に対してどれだけ正確に掌握しているかを検証します。

今回発表されたGPT-4.5SimpleQAテストで優れたパフォーマンスを示し、より深く広範な知識基盤を持つことが示され、多領域の問題に対してより正確で真実味のある回答ができ、以前のモデルで一般的だった知識上の誤り(幻覚)を著しく減少させ、ユーザーにより信頼性があり信用できる回答体験を提供します。

「感情知能(EQ)」の向上

言語モデルの規模が拡大するにつれ、AIが解決できる問題はますます複雑になります。そのため、それらが人間のニーズや意図をよりよく理解することが重要です。

GPT-4.5OpenAIは特に、小さなモデルからデータを取得して、より強力な大規模モデルを訓練する新しいスケーラブルな訓練方法を開発しました。この方法により、GPT-4.5の誘導性、微妙な違いの理解能力、そして自然な対話レベルが大幅に向上しました。

世界に対する深い理解とより強い協調能力を組み合わせることで、GPT-4.5は人間とのインタラクションの中でアイデアをより自然で温かい形で統合し、より本物の人間交流シナリオに近づけます。具体的には、GPT-4.5は以下のように機能します:

  • 人間が本当に伝えたいことをより正確に理解し、交流中の微妙な手がかりや潜在的な期待を捉え、より高い「感情知能(EQ)」を持っています;
  • より強力な美的直感と創造力を持ち、執筆やデザインなどの分野で特に優れた表現を見せます。

標準的な学術ベンチマークテストでのパフォーマンス

いくつかの通常の学術ベンチマーク(academic benchmarks)でテストされます。これらのベンチマークは通常、モデルが伝統的な推論問題を解決する能力を評価するために使用されます。

GPT-4.5は無教師学習(unsupervised learning)の規模を単に拡大しただけであり、推論能力を特別に強化していないにもかかわらず、これまでのGPT-4oモデルよりも各タスクでのパフォーマンスが著しく優れています。

GPT-4.5の実際の応用事例

GPT-4.5は、知識がより広く深くなるだけでなく、ユーザーと適切にインタラクトする方法も熟知しています:いつ更多信息を与えるべきか、いつユーザーをさらなる交流に誘導すべきか。

🌱 困難な時を共に過ごす

ユーザーが感情的低潮や挫折に陥ったとき、GPT-4.5はユーザーの微妙な感情信号を鋭敏に捉え、適時に懸念や共感を表明し、辛抱強く聞き、穏やかにユーザーを話題に誘導し、ストレスを和らげ、困難から脱出する助けとなります。

🖼️ 芸術作品の簡単な識別

ユーザーが未知の絵画の画像または説明を提供すると、GPT-4.5は迅速にそのスタイル、ジャンル、アーティスト、制作年代を識別し、詳細な情報を提供します。また、ユーザーの興味点を適時に尋ね、深くインタラクティブな芸術交流体験を作り上げます。

🚀 壮大な宇宙の探求

ユーザーが宇宙探査に関する様々な疑問に対しても、宇宙の謎、天文知識、あるいは具体的な宇宙任務の進展に関わらず、GPT-4.5はユーザーが本当に知りたい内容を正確に理解し、詳細で権威ある情報を提供します。また、ユーザーの会話意図を巧妙に判断し、より深い宇宙探査の議論を展開するか、直接かつ豊富な情報を提供することで、ユーザーが必要とする情報を効率的に得られるよう支援します。

安全性

AI能力の毎回の向上は、モデルの安全性を強化する良い機会です。
GPT-4.5のトレーニングには、新たな監視技術が導入され、従来の監視微調整(SFT)と人間フィードバック強化学習(RLHF)の方法が組み合わされています。これらの方法は以前のGPT-4oでも使用されました。
全安全性ストレステストの結果は、この能力の拡張がモデルの全体的なパフォーマンスと信頼性を大幅に向上させたことを示しています。

GPT-4.5の使い方

🌐 ChatGPTでの使用

  • ChatGPT Proユーザーは即日より、ウェブ版、モバイル版、デスクトップ版のモデルセレクターでGPT-4.5を選択できます。
  • 来週からは、段階的にChatGPT Plusユーザーとチームユーザーに開放され、再来週にはエンタープライズ版とエデュケーション版ユーザーにも開放されます。
  • GPT-4.5はインターネット接続による最新情報の検索、ファイルや画像のアップロードが可能で、canvas機能を使用して効率的な執筆やプログラミングコラボレーションが可能です。
  • 現在、GPT-4.5は音声モード(Voice Mode)、ビデオや画面共有などのマルチモーダル機能はサポートされていません。

🛠️ APIでの使用

すべての有料ユーザー層の開発者向けに、以下のAPIでGPT-4.5のプレビューが公開されています:

  • Chat Completions API
  • Assistants API
  • Batch API

GPT-4.5は関数呼び出し(function calling)、構造化出力(Structured Outputs)、ストリーミング(streaming)、システムメッセージ(system messages)などの主要機能をサポートしており、画像入力によるビジョン機能(Vision Capabilities)もサポートしています。

早期テストによると、GPT-4.5は特に高い感情知能(EQ)と創造力を必要とするアプリケーションに非常に適しています。例えば:

  • 執筆支援
  • コミュニケーション
  • 学習指導
  • 心理カウンセリング
  • クリエイティブなブレインストーミング

さらに、マルチステップコーディングワークフロー、複雑なタスク自動化など、AIエージェントの場面でも優れたパフォーマンスを発揮します。

モデルコストと将来計画

GPT-4.5は非常に計算集約型のモデルであるため、コストはGPT-4oよりも高く、GPT-4oを置き換えるものではありません。私たちは、長期的なAPIサービスでGPT-4.5を継続提供するかどうかを評価し、既存の能力と将来のモデル開発のバランスを取る努力を続けます。

試用

この画像理解は少し物足りないですね、どうやら私たちi人を理解していないようです。


人生のメンター。

心理医師。

これなら彼氏よりもずっと面白いですね。