サムは4oの発表会後にロガン・バートレットによるインタビューを受けました。

今日は、SamがLogan Bartlettとのインタビューを受けたのを聞きました。そのポッドキャストは次のリンクで見ることができます:https://castbox.fm/vd/701477381。いくつかの考えが非常に興味深かったので、ここでスクリプトを共有します。

4o 初体験

  • Logan: あなたは今日の朝、多モード(Multimodal)4oに関する発表をしましたよね。合っていますか?あのΩマークのことです。
  • Sam: ああ、それは「オムニ」(全能)を意味します。
  • Logan: それはテキスト、音声、視覚に適用されます。なぜこれが重要なのか教えていただけますか?
  • サム:なぜなら、これはコンピュータを使うための驚くべき方法だと思うからです。私たちは長い間、Siriのような音声でコンピュータを操作するというアイデアを持っていましたが、それが自然に感じられることはほとんどありませんでした。しかし今回は、それが行うことができる機能、速度、他のモーダリティとの統合、トーンの自然さ、そして話すスピードを速くしたり別の声で話させたりできる点など、さまざまな理由があります。この流動性と柔軟性は、私がどれだけ気に入っているか信じられないほどです。
  • ロガン:スパイク・ジョーンズ(映画監督)は誇りに思うだろうね。特に好きなユースケースはある?
  • サム:私はまだ約一週間しか使っていませんが、驚くべきユースケースの一つは、集中して作業をしているときに机の上に電話を置き、ウィンドウを切り替えたり現在やっていることを変えることなく、それを別のチャネルとして使うことです。例えば、何かをしている時に通常は別のタブに切り替えてGoogleで検索するところですが、今ではその必要がなく、直接質問してすぐに答えを得られます。そして、パソコンで見ている内容を変えずに済むのです。それは本当にクールな体験です。

技術実現

  • ロガン:実際にそれが達成された理由は何ですか?アーキテクチャの変更によるものでしょうか、それともより多くの計算能力によるものですか?
  • サム:这是我们过去几年学到的所有东西的结合。我们一直在研究音频モデル、视觉モデル,并努力将它们结合起来。我们也一直在寻找更有效的方式来训练我们的モデル。这并不是说我们一下子解锁了全新的东西,而是把许多拼图块组合在一起。
  • ロガン:可用性を向上させるために、遅延を減らすためにデバイス上のモデルを開発する必要があると思いますか?
  • サム:ビデオに関しては、ネットワークの遅延を処理するのが難しいかもしれません。例えば、ARメガネをつけて、世界をリアルタイムで言いながらその変化を見るのは、ずっと驚くべきことだと感じていますが、これもネットワーク遅延下ではさらに難しくなるでしょう。しかし、この技術では、200〜300ミリ秒の遅延でも非常に速く感じ、多くの場合人の反応より速いです。
  • ロガン:あなたが言っているのはビデオ内の画像のことですか?
  • サム:申し訳ありません、生成されるビデオのことを指しており、入力ビデオではありません。
  • ロガン:了解しました。だから今の段階では実際のビデオを処理できる、そうですね?
  • サム:フレームごとに処理します。

GPT-5

  • ロガン:あなたは最近、ChatGPTの次の大きなリリースがGPT-5ではないかもしれないと話していました。それはモデル開発において段階的なアプローチを取っていると理解していいのでしょうか?つまり、将来大きなバージョンアップのリリースではなく、その代わりに...
  • サム:まだ本当にわかりません。私が学んだことは、AIと驚きはあまり相性が良くないということです。伝統的なテクノロジー企業が製品をリリースする方法が私たちには当てはまらないかもしれませんが、GPT-5を別の形でリリースする可能性もありますし、別の名前にするかもしれません。しかし、これらのものをどのように命名し、ブランド化するかについてはまだ答えを見つけられていません。私にとって、GPT-1からGPT-4までの命名は意味がありました。そして今、明らかにGPT-4は大幅に進化しています。また、ある種の「仮想的な脳」というアイデアもあり、状況によってはより深く考える能力を持つかもしれない、あるいは異なるモデルであっても、ユーザーにとっては違いが重要でない場合もあるでしょう。したがって、これらの製品をどのように市場に出すかについてまだ決まっていません。

計算需要

  • ロガン:それはつまり、モデルの進歩に必要な計算能力の要求が以前よりも少なくなる可能性があるということですか?
  • サム:私は常に手に入る最大限の計算能力を使用すると考えています。私たちは信じられないほどの効率向上を達成しており、それは非常に重要です。今日発表された素晴らしいものは明らかに音声機能ですが、おそらく最も重要なのはそれを非常に効率的にし、ユーザーに無料で提供できるようになったことです。世界最高のモデルを、ChatGPTをダウンロードしたい誰でも無料で提供できるというのは、GPT-4やGPT-4 Turboと比べても著しい効率の向上です。そして、さらに改善の余地があります。

世界を変える

  • ロガン:あなたが以前言ったのを聞いたことがあります。ChatGPT自体は世界を変えなかったが、人々の世界に対する期待を変えた、と。
  • サム:はい、選んだ経済指標においても、ChatGPTが本当に生産性を向上させたり他の面で影響を与えたという証拠はあまり見つかりません。カスタマーサポートなどでは少し影響があったかもしれませんが、もし世界全体のGDPを見てみると、ChatGPTのリリースによる影響がわかるでしょうか?おそらくわかりません。
  • ロガン:ChatGPTがGDPに与える影響を特定できる日が来ると思いますか?
  • サム:特定のモデルがそれを達成したと言うかどうかはわかりませんが、数十年後のグラフを見たときに何かが変わったことがわかると思います。

未来1年

  • ロガン:今後12ヶ月で、どのアプリケーションや分野が最も有望だと考えていますか?
  • サム:これは私たちがここですべきことに関連しているので偏見があるかもしれませんが、コード記述は非常に大きな応用分野になると思います。
  • ロガン:これは「苦い教訓」に関連しています。あなたは最近、深い専門化モデルと真の推論を行うことができる汎用モデルの違いについて議論しました。
  • サム:私は汎用モデルが重要になると考えています。
  • ロガン:あなたの考えでは、特定のデータセットに焦点を当てたり、非常に狭いタスクに関連するすべての統合を行うことと、汎用的な推論能力を持つことのどちらがより重要ですか?
  • サム:もしモデルが汎用的な推論を行い、新しいものを発見することができれば、新しい種類のデータを処理する必要があるときに、それを与えるだけで対応できます。しかし、その逆はありません。私は多くの専門モデルを組み合わせても汎用的な推論ができるとは思いません。
  • ロガン:では、それは専用モデルのコーディングにどのような影響を与えますか?
  • サム:より良い言い方は、最も重要なことは真の推論能力を理解し、それを様々なことに応用できるということです。

今後2年間

  • ロガン:あなたは2年後に、人間とAIの間での主要なコミュニケーション形式が何かと考えていますか?
  • サム:自然言語は非常に有望だと考えています。そして、人間とAIが同じ方法で使用できる未来のデザインに関する全体的なアプローチに興味があります。そのため、他の形態のロボットよりも、人型ロボットに特に興味があります。なぜなら、世界は現在人間に非常に適しており、より効率的なもののために再構成されることを望んでいません。私は、人間に最適化された言語でAIと交流するというアイデアが好きです。もしかするとAI同士もそのような方法で交流できるかもしれませんし、これは追求すべき価値のある方向性だと思います。

モデルのパーソナライズ

  • ロガン:あなたは最近、モデルが最終的に時間とともに商品化されるかもしれないが、最も重要なのはおそらく各個人にモデルをパーソナライズすることだと言いました。その通りですか?
  • サム:確信はありませんが、私にとってそれは合理的なことのように思えると思います。
  • ロガン:では、パーソナライズ以外に、結局、エンドユーザー市場を獲得するのは一般的なビジネスインターフェースや使いやすさだと思いますか?
  • サム:これらは間違いなく重要で、常にそうでした。他のいくつかのことを想像できます。例えば、ある種のマーケットプレイスやネットワーク効果の存在、私たちが希望する代理間の相互コミュニケーション、異なる会社のアプリストアなどです。しかし、私はビジネスのルールが通常適用されると考えています。新しい技術があるたびに、それらが適用されないと思われるかもしれませんが、それはいつも偽ニュースです。伝統的な価値創造の方法はここでも依然として非常に重要です。

オープンソースモデル

  • ロガン:オープンソースモデルがベンチマークに追いついたり、それに関連するすべてを見たとき、あなたの反応は何ですか?
  • サム:それは素晴らしいと思います。他の多くの技術と同様に、オープンソースモデルにはその地位があり、ホスティングされたモデルにも地位がありますし、それが良いことだと思います。

AIインフラストラクチャ

  • ロガン:具体的な話題について尋ねるつもりはありませんが、報道によるとあなたたちが大量の資金調達を検討しているとのことです。『ウォール・ストリート・ジャーナル』はこれが信頼できる情報であるとしており、半導体製造への投資を促進することを目指しています。台積電やNVIDIAなどの企業はすでにAIインフラストラクチャの需要に対応するために積極的に拡張しています。あなたは最近、世界が必要とするAIインフラストラクチャはさらに増えるだろうと言及しましたが、現在台積電やNVIDIAから得られているものよりもさらに多くのAIインフラストラクチャが必要だと感じる理由は何かありますか?
  • サム:まず、私は現在のシステムの提供コストを大幅に削減する方法を見つけられるという確信を持っています。そして、それに伴い、需要が大幅に増加すると確信しています。第三に、より大きく優れたシステムを構築することで、さらに需要が増加すると信じています。私たちは、人々が様々なことにそれを活用できるような、知能的なコンピューティング力が豊富にある世界で生活することを望むべきです。例えば、それが私のすべてのメールを読んで返信するのを助けてくれることを希望するかどうか、またはそれが癌を治療することを希望するかどうかを考えなくても済むようにです。答えは、私たちはこれら両方を同時に実現したいと考えているということです。ただ、そのための十分なリソースがあることを確保したいのです。

物理デバイス

  • Logan: 個人の努力に関するコメントは必要ないよ、もしあなたが望むなら教えてくれてもいいけど。HumaneやLimitlessなどのいくつかの物理的なアシスタントデバイスについて、あなたが思うに問題だと感じている点は何ですか?または、ユーザーの採用率が予想を下回っている理由は何だと思いますか?
  • Sam: まだ早い段階だと思う。私はこれまで多くの種類のコンピューティングデバイスの早期採用者だった。大学時代には康柏TC1000を使っていてとても気に入っていた。それはiPadよりずっと前のことだけど、方向性は正しかった。その後、Treoも買った。当時の私は非力な大学生で、古いPalm Treoを使っていた。それはまだ流行の製品ではなかったが、最終的にiPhoneが登場した。これらのものは非常に有望な方向性を持っているが、いくつかの改良が必要だ。

未来のAI企業

  • Logan: あなたは最近、GPT-4に基づく多くの企業が将来的なGPTによって圧倒されると述べていました。この点についてもう少し詳しく説明してくれますか?そして第二に、どのAI主導の企業がGPTの進化の中で生き残ることができると思いますか?
  • サム:唯一有効なフレームワークは、未来のモデルが非常に良くなることを賭けてビジネスを構築するか、またはそれが良くならないことを賭けて構築する方法だということに気づきました。GPT-4の能力を超えて何とか実現するために多くの努力を費やしたとしても、GPT-5が出てきてそれが他のすべてのことと同じくうまくいく場合、あなたは自分が行った努力を無駄だったと感じるかもしれません。しかし、特定のユースケースに焦点を当てず、あらゆる面で使えるビジネスを持っている場合、GPT-5やその他のバージョンが登場し、すべての面で向上すれば、その向上から恩恵を受けられます。ほとんどの場合はAIビジネスを構築しているわけではなく、単にAIを使用する技術としてビジネスを構築しているのです。初期のApp Storeのように、明らかに不足している部分を補うアプリが多く存在していましたが、最終的にアップルがそれらの問題を解決し、手電筒アプリはOSの一部になりました。一方で、Uberのような会社はスマートフォンを利用して非常に防御力のある長期的なビジネスを構築しました。私は後者を目指すべきだと思います。
  • ロガン:あなたの技術を利用する既存企業で、このフレームワークに当てはまるものがたくさん思い浮かびます。ある意味で、Uberのような新しい概念で、このような例となる企業や興味深いものがありますか?
  • サム:実際に、新規企業がこれらの状況の多くで勝ち抜くと考えています。よくある例はAIドクターやAI診断士の構築です。人々はメイヨー・クリニックや他の大企業がそれをやるだろうからこの分野で起業したくないと言うけれど、私は実際に新しい企業がこのようなことをするだろうと思っています。
  • ロガン:このようなタイプの破壊に対応するために積極的に準備しようとするCEOたちに、何かアドバイスはありますか?
  • サム:私はこう言います。毎年、知能型サービスが良くなり安くなることを前提にするのは必要ですが、競争に勝つための十分条件ではありません。だから、数年かかる大企業を打ち負かすことはできますが、それに注目しているスタートアップも同じことをしますので、私のビジネスの長期的な防御力は何なのかを考えなければなりません。現在の競争環境は長い間で最もオープンであり、新しいことができますが、それでも構築し続ける価値のあるハードワークを軽視してはいけません。

未来の仕事

  • ロガン:AIの存在によって、5年後に主流になるかもしれない仕事や職務を想像できますか?現在はニッチなものまたは存在していないものですが。
  • サム:それは良い質問ですね、これまでに聞かれたことがありませんでした。人々はいつもどの仕事がなくなるのか尋ねますが、新しい仕事のほうがあまりにも面白い問題です。考えてみましょう。あまり面白くない、または重要ではないと考えられる多くのことを思いつきますが、私は1億人や5千万人がするであろう新しい分野を見つけたいのです。全体的なカテゴリーとしては、新しい芸術、エンターテインメント、そしてより人間らしいつながりに関連するものが考えられます。この職種が何と呼ばれるかはわかりませんが、これが非常に大きな新しい領域になる可能性があると思います。5年以内にそこに到達できるかどうかはわかりませんが、人との対面での素晴らしい体験に対する需要が高いと考えています。

OpenAIの評価額

  • ロガン:最近、OpenAIの公開されている評価額は約900億ドルほどです。AGI以外で、OpenAIを兆円企業にするのに一、二つの重要な要素は何だと思いますか?
  • サム:もし我々が現在のペースで技術を改善し続け、それを用いて良い製品を開発し、収益を増やし続ければ——具体的な数字は分からないが——大丈夫だと私は思っている。
  • ロガン:今のビジネスモデルは、あなたが考える兆ドル規模の株式価値を生み出せるものだと思いますか?
  • サム:ChatGPTのサブスクリプションモデルは、予想以上にうまくいっています。これには驚きました。私が最初からこれほどの成功を確信していたわけではありませんが、結果的にうまくいっています。
  • ロガン:AGIが実現した後、それが何を意味するにせよ、我々はAGIに尋ねて、ビジネスモデルが異なるものになるかどうか確認できると思いますか?
  • サム:はい。

会社構造

  • ロガン:去年の11月頃に、現行のOpenAIの構造にはいくつかの欠点があることが分かったかもしれません。しかし、それをもう一度議論する必要はないと思います。あなたは既に何度も話されていますが、私は未来における適切な構造についてどのように考えているかを尋ねたいと思いました。
  • サム:私たちはその話をする準備が整いつつあると思います。様々な対話を重ね、アイデアを出し合い、今年中にこの問題について正式に議論できると期待しています。
  • ロガン:ラリーとブレット・テイラーが取締役に昇格したとき、私も電話を待っていましたが、それは来ませんでした。

AIの期待

  • ロガン:AIの期待や収益化モデルについて、面白い視点だと思うのは、あなたが以前述べた「まず手作業に影響があり、次にホワイトカラーの仕事、最後にクリエイティブな仕事が影響を受ける」というものです。しかし、実際には状況が逆になっているようです。他の面でも、予想していたことが実際に全く反対になったことはありますか?例えば、こうなると思っていたけど全然違った、といったことです。
  • サム:あなたが言ったその点は最大の驚きでした。私はAIがこれほど早く法務の仕事を得意とするとは思いませんでした、なぜならそれを非常に精密で複雑なことだと考えていたからです。しかし間違いなく、最大の驚きは肉体労働、認知労働、そしてクリエイティブ労働に関する観察でした。

AGI

  • ロガン:あなたはAGIに関して多くのことを話してきましたし、なぜその用語が好きではないかも説明しました。その視点についてもう少し詳しく教えていただけますか?
  • サム:今では、それが瞬間的な出来事だとは思っていません。どの会社を立ち上げるときでも、特に変化の速い分野では、多くの天真的な考えがあります。私たちが始めた当初、私はAGI(人工一般知能)がない段階を経て、突然AGIが現れるだろうと天真的に考えていました。それは大きな飛躍になるだろうと思っていました。それでもまだ、本当に大きな飛躍がある可能性はありますが、全体的には指数関数的な連続的なカーブに近いと考えています。重要なのは毎年の進歩のペースです。私たちは具体的な月や年については一致しないかもしれませんが、それがAGIであることに同意できるでしょう。他のテストも提案できますが、それも思ったよりも難しいものです。GPT-4は明らかにほとんどの人がAGIと呼ぶレベルには達していませんし、次の大きなモデルも達するとは思っていませんが、少数のアイデアやスケールの向上で新しい段階に到達する可能性は想像できます。警戒し続けることが重要だと思います。
  • ロガン:現代版のチューリングテストのようなものはありますか?例えば、バートレットテストとでも呼びましょうか、それがその閾値を超えたときに、あなたはそれがAGIに達したとみなしますか?
  • サム:それがOpenAIのすべての研究者よりも、あるいは単独のOpenAI研究者よりも優れた研究を行えるようになるのは非常に重要なことだと思います。それはおそらく、またはべきである断層線となるでしょう。
  • ロガン:それは近いと感じますか?
  • サム:多分そうではないかもしれませんが、その可能性を排除はしません。
  • ロガン:あなたが考えるに、AGIに到達するための最大の障害は何ですか?現在のスケール法則が今後数年間持続できると考えているように聞こえますが、どう思いますか?
  • サム:私は新しい研究が最大の障害だと考えています。私が学んだ一つのことは、インターネットソフトウェアからAIへの移行において、研究はエンジニアリングのように計画通り進まないということです。通常、それは時間がかかり、うまくいかないこともあります。しかし、時々それは誰も予想しないほど早く進展します。
  • ロガン:その観点についてもう少し詳しく説明できますか?進展が線形ではないということについてです。
  • サム:最も良い説明は歴史的な例だと思います。いくつかの数字は間違っているかもしれませんが、誰もそれを修正することはないと思います。例えば、中性子は20世紀初頭に初めて提唱され、おそらく1920年代に初めて検出され、原爆の研究は30年代に始まり、40年代に完成しました。中性子の存在を知らなかった段階から原爆を作り出すまで、それは私たちの物理に関するすべての直感を覆す非常に迅速な進展でした。他にも多くの例があります。ライト兄弟の飛行のように、彼らは1906年に飛行にはまだ50年かかると思っていたのに、1908年には実現していました。このようなことがたくさんあります。また、予測したことが起こらない場合や、想定よりも時間がかかる場合もありますが、時折非常に速い進展があるのです。

説明可能性

  • ロガン:説明可能性に関して、私たちはどの段階にいますか?長期的に見てAIにとってどれほど重要になりますか?
  • サム:説明可能性にはさまざまな種類があります。例えば、ネットワーク内の各層のメカニズムを理解しているかどうか、あるいは出力における論理的欠陥を見ることができるかどうかなどです。私はOpenAIや他の場所で行われているこの方向性への取り組みに期待していますし、説明可能性というより広い分野は有望で興味深いと考えています。
  • ロガン:明確な答えを急がせないつもりだ。君が準備ができたら発表するだろうと仮定している。それは主流のAIアプリケーションにとって必須の条件だと思うか?もしかすると企業内での使用においては必要かもしれないのか?
  • サム:GPT-4はまだ完全にそのレベルには達していないが、それは妥当な質問だ。

規制

  • ロガン:君はいくつかの質問や批判を受けたりするかもしれない。これは少し強すぎる表現かもしれないが、人々はこれについて懸念を持っている。その一つは、AGI(人工一般知能)への興奮と、それをOpenAIが掌握し、一方的に決定を行うことに対する君個人への懸念だ。これが議論として、選挙を通じてリーダーを選ぶべきだというガバナンス構造が必要になる可能性がある。
  • サム:現在の能力モデルに対して厳重な規制を設けることは間違いだと私は考えている。しかし、モデルが世界に対して重大な災害リスクを引き起こす可能性がある場合、何らかの監視が良いことだと考える。これらの閾値やテスト基準を設定する際には微妙なバランスが必要だが、この技術を完全に止める巨大な利点と、人々が自宅でモデルを訓練することを許可する間には大きな差がある。もし国際的な核兵器規則があれば、それは良いことだと思う。
  • ロガン:この問題について、投資家の一部はこのような規制が悪いと考えており、リスクがあると考えています。あなたはAIの潜在的な固有リスクについてどう思いますか?
  • サム:彼らは実際にAGI(汎用人工知能)の可能性に真正面から向き合っていないと思います。AI規制に大声で反対している人々は、つい最近までAGIの可能性を完全に否定していました。私は彼らの立場を理解します。規制は技術全体にとって一般的には害になることが多いです、例えばヨーロッパのテクノロジー産業のように。しかし、私たちが一つの閾値を超えると、その先では感覚が変わるかもしれません。
  • ロガン:あなたはオープンソースモデル自体が何らかの意味で固有の危険性を持っていると考えますか?
  • サム:現在のモデルにはありませんが、そうなるものが登場する可能性は容易に想像できます。
  • ロガン:あなたは安全性が何らかの意味で誤った枠組みであると言っていたことがありますが、それは航空安全などと同じように、私たちが何を受け入れるかに関するものだからです。
  • サム:安全性は二項の概念ではありません。あなたが飛行機に乗りたいと思うのは、彼らが安全だと感じているからであって、たまに墜落することが分かっているにも関わらずです。航空の安全性に関する基準は議論の結果であり、それぞれの人々が異なる意見を持っています。全体的に見て、飛行機は非常に安全になっていますが、それが事故がないことを意味するわけではありません。
  • ロガン:同様に、医学には副作用があり、一部の人々は悪影響を受けることがありますし、ソーシャルメディアも負の影響をもたらします。安全性には見えない側面もあり、例えばソーシャルメディアの負の影響などです。安全性に関するパラダイムにおいて、何か状況があって進める姿勢を変えますか?
  • サム:私たちは「準備フレームワーク」というものを用意しており、これらのカテゴリーやレベルに基づいて異なる行動を取ります。

AGI(人工一般知能)加速

  • ロガン:私は以前、エリエザー・ユドコウスキーをこの番組に招きました。彼は多くの自分の考えについて話しました。あなたは急速な起飞シナリオが可能だと思うのですか?
  • サム:もちろん可能性はありますし、現在のトランスフォーマー構造を変更する必要すらないかもしれません。しかし、それが私が最も可能性が高いと考える道ではありませんが、その可能性を否定することはありません。私は物事がより連続的に進むと思いますし、加速しているとしてもです。ある日、かなり優れたAIを持って寝て、翌朝起きたら本当のスーパーアイントレリジェンスがある、とは思っていません。しかし、たとえ爆発的な成長が1年や数年にわたったとしても、それはある意味で速いと言えるでしょう。さらに、非常に強力なAGIに到達したとしても、それが社会をどの時点で変えるのか、次の日のことか、翌年か、それとも次の10年以内かという問題もあります。私の推測では、ほとんどの場合、それは次の日や翌年の話ではなく、10年間で世界は大きく異なるものになるだろうと思います。ここで社会の慣性が役立つと考えています。

株式

  • ロガン:人々はいくつかの問題について懐疑的であり、あなたが答えたくないと思っている質問は、エロンに関するもの、株式、そして11月の取締役会の構造に関するものです。これらはおそらくあなたが何度も答えている中最も答えたくない3つの質問だと思うのですが、どれが一番ですか?
  • サム:これらの質問を嫌っているわけではありません、ただ新しいことを言う材料がないだけです。
  • ロガン:具体的な株式に関する質問はしません、なぜならあなたがすでに何度も答えていて、それでも人々が「十分なお金」という答えを好まないようだからです。
  • サム:もし私が1兆ドルを稼いでそれを寄付したら、それは人々の期待に沿った行動や一般的なやり方になるかもしれません。もう一つの考えとしては、何らかの方法でそれを実現しようとすることがあります。比較すると、単純に言えば、大金を稼ぐほとんどの人は最終的にそれを寄付するということです。

動機

  • ロガン:あなたがAGIを目指す動機は株式以外に何ですか?私は多分、多くの人がそう感じると思いますが、たとえ何か崇高な使命を持っていても、それでもなお報酬を得ることができると。では、今の仕事に来ることで、あなたが最も達成感を感じるのはなぜですか?
  • サム:私はよく他人に言っていますが、今なら生活における多くの妥協や犠牲をしてでもこれを行う価値があると思っています。なぜなら、これが私が関わることができる最も興奮し、最も重要で、最高のものです。これは狂気の沙汰のような時代ですが、私はとても幸せです。そして、これが永遠に続くわけではないことも理解しています。いつか、農場に引退して、この時代を懐かしく思いながらも「あぁ、あの日々は本当にストレスフルで長く、緊張していた」と思うでしょう。しかし、それも非常にクールで、それが私に起こっていることに驚き、信じられないほど素晴らしいことです。

特別な瞬間

  • ロガン:最も非現実的だと感じた瞬間はありますか?例えば、あなたの都市で外出できないという例などはどうでしょう?あなたはビル・ゲイツとポッドキャストをしましたよね。あなたのクイックダイヤルには多くの興味深い人がいると思いますが、もし今私の手にあなたの携帯電話が渡されたら、そこに多くの有名人が登録されているでしょうか?過去数年間で、独特で超現実的な瞬間を感じたことはありますか?
  • サム:ほぼ毎日、「わぁ、もう少し考える時間が多ければ、これかなり驚くべきことだ」と感じる瞬間があります。それはまるで魚が水中にいるようなものです。11月に起こった出来事の後、私は世界各地から大統領や首相などからの10~20通のメッセージを受け取りましたが、それが一番奇妙な部分ではありませんでした。奇妙だったのは、すべてが普通に感じられたことです。私たちは4日半、ほとんど眠らず、食べず、非常に高い集中力と明晰さを持ちながらも、体はアドレナリン過多の状態にありました。それは感謝祭の一週間前のことでしたが、非常に狂っていました。火曜日の夜に解決し、その水曜日、感謝祭前の水曜日に、エイリーと一緒にナパ・ヴァレーに向かう途中、レストランで食事をするために立ち寄りました。車を運転している間に、数日間何も食べていないことに気づき、すべてが通常に戻りました。メインディッシュを4つ、シェイクを2杯注文し、自分だけのために食べました。とても満足感がありました。食べている最中に、ある国のリーダーからまた謝罪のメッセージが届きました。そして、多くの人々が私にメッセージを送ってきたことが「普通」に感じられることに気づきました。奇妙なのは、これが非常に奇妙な経験であるべきだったのにそう感じなかったことです。この瞬間が印象深かったです。人間はどんな状況にも適応できる能力を持っていると感じます。それは良いことも悪いことも含めてです。過去数年間でこのことを学び、驚いています。これは人類の非凡さを示しており、私たちにとって良い兆候です。大きな変化に直面しているからです。

ユニークな人間の特性

  • ロガン:モデルがますます賢くなっていくと考えたとき、何が常にユニークな人間の特性として残るとお考えですか?
  • サム:何年も先になっても、人間は他の人を気にかけ続けるでしょう。オンラインで皆さんがChatGPTに恋をするだろうとか、ChatGPTガールフレンドを持つだろうといった話を読みましたが、私はそうはならないと思います。私たちは長い間、他者に対してさまざまな形で関心を持っており、それは引き続き私たちの執着となるでしょう。私は主にロボットがサッカーをするのを見るのが好きになるとは思いません。

OpenAIを運営する

  • Logan: あなたがこのOpenAIという会社を運営している間、YCで築いた企業の運営に関する多くのルールやフレームワークがありましたよね。そして、そのいくつかのルールを破りました。採用に関しては、従来のインターネット企業やB2Bソフトウェア企業とは異なるタイプの人材を雇用しますか?
  • Sam: 研究者とプロダクトエンジニアは非常に異なります。
  • Logan: 研究者は独特ですが、OpenAIでは異なるタイプのエグゼクティブも採用しますか?
  • Sam: 私は通常、エグゼクティブの採用には完全に外部からの依存をしません。主に内部から人材を昇格させるべきだと思いますが、一部の上級人材を外部から導入することも重要です。私たちが取り組んでいることにとってこれは非常に重要で、他の会社とは大きく異なることをしているからです。

重要な決定

  • ロガン:OpenAIのプロセスにおいて、どの決定が最も重要だと感じますか?その決定はどのように下されたのですか?
  • サム:一つだけ指摘するのは難しいですが、AGIを秘密裡に構築して一気にリリースするのではなく、反復的な展開を行うという決定は非常に重要だったと感じています。もう一つの重要な決定は、言語モデルに賭けることでした。これが私たちが進むべき道だと決めたのは、当時は大きなリスクのように見えましたが、今振り返ると明らかであり、当時はそうは感じませんでした。
  • ロガン:言語モデルに賭けることに至るストーリーについて教えていただけますか?
  • サム:私たちはロボティクスやビデオゲームなどの他のプロジェクトもありましたが、一人の人物が言語モデルの研究を始めました。イリヤはこの方向性に非常に確信を持っており、私たちはGPT-1、GPT-2を行い、スケール法則を研究し、GPT-3へと拡大しました。そして、これが私たちが進むべき道であると決断し、大きな賭けをしました。

AIの2つの使用方法

  • ロガン:あなたは最近、AIの2つの使用方法について話しました。それは自分自身や最優秀社員を複製することです。これは微妙な違いですが、詳しく説明できますか?
  • サム:今後5年以内に、あなたが私にメッセージを送るとき、それが私に送られるのか、私のAIアシスタントに送られるのかを明確にしたいかもしれません。もしAIアシスタントであれば、それは情報を要約し、後で返信を受け取ることになります。私であれば、それが私が直接処理したものだと知ることができます。これらを分けることは価値があります。私はAIが単に自分の延長ではなく、独立した存在であることを望んでいます。
  • ロガン:音楽や創造的な分野では、DrakeやTaylor Swiftの音声を複製することが容易になります。これらの作品の本物かどうかを確認するために、何らかの形での認証が必要になるかもしれません。
  • サム:確かに、いくつかの認証が必要です。OpenAIの中でも、異なる人が異なるタスクを担当しており、単一のエンティティではありません。AIを自分の延長ではなく、独立した存在として機能させるべきです。

未来の教育

  • ロガン:教育システムに関して、未来に備えるためにどのような変化が必要だと考えていますか?
  • サム:最大の変化は、これらのツールを使用することを人々に許可し、さらには要求することです。場合によっては、理解を助けるために古い方法で物事をする必要がありますが、全体的には現実の生活では電卓を使いますので、それを理解し、上手く使いこなす必要があります。もし数学の授業で電卓を使わなければ、仕事でうまくいかないでしょう。同様に、私たちはAIを使わないことを人々に教え込むべきではありません。なぜなら、それは将来価値のある仕事をするための重要な一部となるからです。

未来の姿

  • ロガン:あなたは以前、AGI(人工一般知能)が知能の連続体上の一つの点に過ぎないと述べ、進歩が続く可能性があると話していました。未来の姿について考えたり、想像したりすることはありますか?
  • サム:よくね。私は飛行車やスター・ウォーズのような未来の都市を想像するわけではなく、一人の人間が数百人や数千人の仕事をこなすことができ、そして私たちはすべての科学を発見できるような感覚を想像するんだ。それはとてもクールだろう。