OpenAIの最新モデルo1 - 回答する前に考える、考える時間が長ければ長いほど賢くなる

OpenAI o1 モデル

OpenAIは最近、一連の新しいAIモデルを発表しました。これらのモデルは回答する前により多くの時間をかけて考えます。今回は2つのモデルが公開されました：

1. OpenAI o1-preview

チームはOpenAI o1-previewモデルを開発し、AIが回答する前により多くの時間をかけて考えるよう設計しました。これらは複雑なタスクを推論し、以前のモデルよりも挑戦的な問題を解決でき、特に科学、プログラミング、数学の分野で優れたパフォーマンスを発揮します。

2. OpenAI o1-mini

OpenAI o1-miniはSTEM分野（特に数学とプログラミング）で卓越した成果を示しており、AIMEやCodeforcesなどの評価基準において、その性能はほぼOpenAI o1に匹敵します。o1-miniは広範な世界知識が必要ないが推論能力が必要なアプリケーション向けに、より迅速でコスト効果の高いモデル選択肢となります。

ビデオを見る

コーディング例

：簡単なプロンプトだけで、o1はHTML、CSS、JavaScriptを使用してスネークゲームを作成できます。ゲームデザインだけでなく、様々なロジックも追加されます。コードをコピーすると、完全なスネークゲームが手に入ります。難易度を上げたい場合は、「AI」の文字を障害物として使用できます。o1はいくつかのロジックを追加し、画面中央に大きな「AI」障害物を持つスネークゲームを生成しました。

：o1は以前のモデルでは不可能だったタスクを完了できます。例えば、Pygameを使用して「リスを探す」ゲームを作成する場合、o1は21秒間考えてから、完全なコードを出力しました。

パズルと創作

：「ライティングパズル」では、特定の音節数を持ち、母音で終わる単語を含む六行詩を求められました。o1は要求に従って非常に高品質な詩を出力しました。

：複雑な問題が提示されました：

「姫の年齢が彼らの現在の年齢の合計の半分であるときに、姫の年齢は王子の年齢の二倍です。姫の年齢が王子の過去の年齢の二倍になるとき、姫の年齢は王子の未来の年齢に等しくなります。王子と姫の年齢は何歳ですか？すべての解を示してください。」

o1はこの問題を解析し始め、しばらく考えてから詳細な解答過程と公式を与え、最終的に正しい答えを計算しました：王子と姫の年齢はそれぞれ6k歳と8k歳であり、kは任意の整数です。

推論と理解

：「strawberry」という単語の中にいくつの「r」があるか尋ねると、以前のモデルは誤答することがありますが、o1は数秒考えてから正しい答えを出します。

：誤りのある韓国語の文章を提供し、o1にそれを英語に翻訳させます。o1は混乱したテキストを解読するために時間をかけ、誤りを正しく識別し、適切な理解と翻訳を行いました。（これにより、o1が暗号化されたテキストの解読にも潜在能力を持っていることが示されました。）

異なる学問分野での応用

：o1が量子物理学の問題を解き、複雑な物理式を生成する様子を見ることができます。私たちがそれらの式を理解できなくても、その専門性を感じ取ることができます。

：o1はすべての遺伝情報を使いこなし、生物学分野での強力な能力を示しています。

：複雑な問題に対して：

「どのような条件下で関税が国の貿易条件を改善し、国内福祉を向上させるのでしょうか？このような状況下で、潜在的な関税が良いアイデアではない理由として、公共選択理論に基づく考慮事項を含め、どのような劣位性を考えられますか？」

o1はこの複雑な問題を理解し、詳細な結論を与えます。

OpenAI o1は私よりもずっと賢い

OpenAI o1はユーザーに応答する前に深く考え、内部で長い思考チェーンを生成することができます。

競技プログラミング問題では、o1は第89百分位にランクイン（Codeforces）；
アメリカ数学オリンピック予選（AIME）では、全米トップ500人の学生に含まれています；
物理、生物、化学問題の基準テスト（GPQA）では、博士レベルの人間を超える正確さを示しています。

チーム

OpenAI o1の背後にある研究者たち：https://openai.com/openai-o1-contributions/