スタンフォード『2024年人工知能指数レポート』

一昨日、スタンフォード大学は『2024年人工知能指数レポート』(Artificial Intelligence Index Report 2024)を発表しました。

以下のリンクをクリックしてレポート全文をご覧ください:https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf

以下はそのレポートの簡易サマリーです。詳細を知りたい方は上記リンクからレポートをダウンロードしてください。

レポート概要

第七版人工知能指数レポートをお読みいただきありがとうございます。2024年のレポートはこれまでで最も包括的なものであり、人工知能が社会に与える影響がかつてないほど重要となる時期に発行されました。今年度は、技術の進歩、一般大衆のこの技術に対する認識、そしてその発展を取り巻く地政学的動向など、重要なトレンドについてさらに広範なカバレッジを提供しています。本レポートには過去最高の量の原始データが含まれており、新たに人工知能のトレーニングコストの推定、責任ある人工知能に関する詳細な分析、そして科学や医学への人工知能の影響に焦点を当てた新しい章が追加されています。人工知能指数レポートは、関連するデータを集約し、精錬し、可視化することを目的としています。私たちの使命は、厳密な審査を受けた幅広い出所を持つ客観的なデータを提供し、政策立案者、研究者、企業幹部、ジャーナリスト、そして一般市民が人工知能という複雑な分野をより包括的かつ詳細に理解できるようにすることです。このインデックスは、世界中で最も信頼性が高く権威のある人工知能データと洞察のソースの一つとされています。以前のバージョンは、『ニューヨーク・タイムズ』、『ブルームバーグ』、『ガーディアン』などの主要新聞で引用され、数百回の学術引用があり、アメリカ、イギリス、EU等地域の上層政策立案者たちによって参照されてきました。今年の版は規模と範囲において過去のどの版よりも大きく、人工知能が私たちすべての生活の中でますます重要になっていることを反映しています。

Top 10 Takeaways

  1. :人工知能は画像分類、視覚推論、英語理解などのタスクで人間を超えるようになりました。しかし、競技レベルの数学、視覚常識推論、計画立案などより複雑なタスクでは、AIのパフォーマンスは依然として遅れを取っています。
  2. :2023年には、産業界が51個の顕著な機械学習モデルを生み出しましたが、学界からの貢献は15個にとどまりました。さらに、産業界と学界の協力によって生まれた顕著なモデルは21個に達し、過去最高を記録しました。
  3. :人工知能指数によると、最先端のAIモデルのトレーニングコストは過去最高の水準に達している。例えば、OpenAIのGPT-4のトレーニングコストは7800万ドルと推定され、GoogleのGemini Ultraの計算コストは1億9100万ドルに上る。
  4. :2023年には、61個の重要なAIモデルがアメリカの機関から生まれており、EUの21個や中国の15個を大きく上回っている。
  5. :最新の研究によると、責任あるAIに関する報告書において、標準化の著しい不足が明らかになった。OpenAI、Google、Anthropicなどの主要な開発者は、異なる責任あるAI基準に基づいてモデルをテストしており、これによりトップクラスのAIモデルのリスクや制限を系統的に比較することが複雑になっている。
  6. :昨年、全体的な人工知能(AI)のプライベート投資が減少したにもかかわらず、生成型AIへの資金調達額は急増し、2022年からほぼ8倍に増加して252億ドルに達しました。OpenAI、Anthropic、Hugging Face、Inflectionなどの主要企業が大規模な資金調達ラウンドを報告しています。
  7. :2023年に実施された複数の研究では、AIが労働力に与える影響が評価され、作業をより迅速に完了させ、品質を向上させることが明らかになりました。これらの研究はさらに、AIが低スキル労働者と高スキル労働者の間のスキルギャップを縮める可能性も示しました。一方で、他の研究は、適切な規制なしにAIを使用するとパフォーマンスが低下するリスクがあると警告しています。
  8. :2022年、AIが科学的発見を促進し始めました。2023年には、アルゴリズムのソート効率を向上させるAlphaDevから、材料発見を促進するGNoMEまで、さらなる重要な科学関連のAIアプリケーションが登場しました。
  9. :過去1年間および過去5年間で、アメリカにおけるAI関連規制の数は著しく増加しました。2023年にはAI関連規制が25件に達し、2016年のわずか1件から大幅に増加しました。前年比では、AI関連規制の総数が56.3%増加しました。
  10. :Ipsosの調査によると、過去1年間で「今後3~5年以内にAIが自分の生活に大きな影響を与えるだろう」と考える人の割合は60%から66%に増加しました。さらに、AI製品やサービスに対して懸念を示す人が52%となり、2022年と比べて13ポイント上昇しました。アメリカでは、Pewのデータが示す通り、52%のアメリカ人がAIについて抱く懸念が興奮感を上回っており、これは2022年の37%から上昇しています。

章ごとの内容

本レポートは9つの章に分かれています。各章の内容:

第1章:研究と開発

  1. :2023年には、産業界が51個の顕著な機械学習モデルをリリースし、学界は15個を提供しました。さらに、産業界と学界の協力によって生まれた顕著なモデルは21個に達し、過去最高を記録しました。
  2. :2023年に合計149個の基礎モデルが発表され、これは2022年の2倍以上です。これらの新規モデルのうち、65.7%がオープンソースモデルであり、これに対し2022年と2021年の割合はそれぞれ44.4%と33.3%でした。
  3. :人工知能インデックスの推定によると、最先端のAIモデルのトレーニングコストは過去最高の水準に達しました。例えば、OpenAIのGPT-4のトレーニングコストは約7800万ドルと推定されており、GoogleのGemini Ultraの計算コストは1億9100万ドルに上ります。
  4. :2023年には、61の重要なAIモデルが米国の機関から生まれました。これはEUの21個や中国の15個を大きく上回っています。
  5. :2021年から2022年にかけて、世界中のAI特許付与件数は62.7%増加しました。2010年以来、付与されたAI特許の数は31倍以上に増加しています。
  6. :2022年には、中国が全世界のAI特許発明源の61.1%を占め、アメリカの20.9%を大幅にリードしています。2010年以来、アメリカのAI特許分野におけるシェアは54.1%から減少しています。
  7. :2011年以来、GitHub上のAI関連プロジェクトの数は増加を続けており、2011年の845件から2023年には約180万件に達しました。特に2023年には、GitHub上のAIプロジェクトの総数が59.3%増加しました。同時に、これらのプロジェクトに対するGitHub上の総スター数も2023年に大幅に増加し、2022年の400万から1220万に増加しました。
  8. :2010年から2022年までに、AI関連の出版物の総数はほぼ3倍に増加し、約88,000件から240,000件以上に達しました。過去1年間でのこの増加率は1.1%でした。

第二章:技術性能

  1. AIは画像分類や視覚的推論、英語理解など複数のベンチマークテストで人間のパフォーマンスを超えている。しかし、競技レベルの数学や視覚的な常識推論、計画立案などのより複雑なタスクでは依然として遅れている。
  2. 伝統的なAIシステムは通常機能が単一であり、例えば言語モデルはテキスト理解に優れるが画像処理では不十分であり、その逆も同様である。しかし、最近の進歩により強力な多モードモデルが開発され、GoogleのGeminiやOpenAIのGPT-4などが登場した。これらのモデルは柔軟性を示しており、画像やテキストを処理でき、場合によっては音声も処理できる。
  3. 。AIモデルがImageNet、SQuAD、SuperGLUEなどの既存のベンチマークテストで性能の飽和状態に達するにつれて、研究者たちはより挑戦的な新しいベンチマークを導入しました。2023年に登場した新しいベンチマークには、プログラミング用のSWE-bench、画像生成用のHEIM、一般的な推論用のMMMU、倫理的推論用のMoCa、エージェントベースの行動評価用のAgentBench、そして幻覚評価用のHaluEvalが含まれます。
  4. 。SegmentAnythingやSkoltechのような新しいAIモデルは、画像セグメンテーションや3D再構築といったタスクのために専門的なデータを生成するために使用されています。データはAI技術の改善における鍵です。AIを使ってさらに多くのデータを作成することで、現在の能力を強化し、特に困難なタスクにおいて将来のアルゴリズム改善の道を切り開きます。
  5. 。生成モデルが高品質なテキストや画像などを生成するにつれ、ベンチマークテストは徐々にImageNetやSQuADのような純粋に計算によるランキングから、Chatbot Arenaランキングのように人間評価を含む方向へと移行しています。一般大衆のAIに対する感覚は、AIの進歩を追跡する上でますます重要な考慮要素となっています。
  6. 言語モデリングとロボティクスの融合により、PaLM-EやRT-2のようなより柔軟なロボットシステムが生まれました。これらのモデルは、ロボットの能力を向上させるだけでなく、質問を投げかけることもでき、これは現実世界とより効果的に対話できるロボットへの重要な一歩です。
  7. 長い間、特定の環境で自律的に動作するAIエージェントシステムを作成することは、コンピュータ科学者の挑戦でした。しかし、最近の研究では、自律型AIエージェントの性能が改善していることが示されています。現在のエージェントは、Minecraftのような複雑なゲームをマスターし、オンラインショッピングやリサーチ支援などの現実世界のタスクを効率的に処理することができます。
  8. 10の厳選されたAIベンチマークテストにおいて、クローズドモデルはオープンモデルを上回り、中央値での性能アドバンテージは24.2%でした。クローズドモデルとオープンモデルの性能差は、AI政策に関する議論に重要な影響を与えます。

第三章:責任あるAI

  1. 最新の研究によると、責任あるAIレポートには標準化における著しい欠如が存在します。OpenAI、Google、Anthropicを含む主要な開発者は、異なる責任あるAIベンチマークに基づいてモデルを評価しており、これによりトップクラスのAIモデルのリスクや制限を体系的に比較することが複雑になっています。
  2. 。政治的なディープフェイク動画はすでに世界的に選挙に影響を与えています。最近の研究によると、現在のAIディープフェイク技術の精度にはばらつきがあります。さらに、CounterCloudのような新しいプロジェクトは、AIがいかに簡単に虚偽のコンテンツを作成し、広められるかを示しています。
  3. 。以前は、AIモデルに対するレッドチームテストは主に、人間にとって直感的に意味のある対抗的プロンプトに焦点を当てていました。今年、研究者たちは、LLMに有害な行動を引き起こす可能性のある、より目立たない戦略をいくつか発見しました。例えば、モデルにランダムな単語を無限に繰り返させるようなものです。
  4. 。責任あるAIに関する世界的な調査では、企業が最も懸念するAI関連の問題としてプライバシー、データセキュリティ、信頼性が挙げられています。調査結果によると、各組織はこれらのリスクを軽減するための措置を講じ始めています。しかし、世界全体を見ると、ほとんどの企業はこれまでにこれらのリスクの一部しか解決していません。
  5. 。複数の研究によると、人気のあるLLMの生成出力には、「ニューヨーク・タイムズ」からの抜粋や映画のシーンなど、著作権のある資料が含まれることがあります。このような出力が著作権侵害に該当するかどうかは、中心的な法的問題になりつつあります
  6. 。新たに導入された基盤モデル透明性インデックスは、AI開発者が特にトレーニングデータや方法論の開示において透明性に欠けていることを示しています。この閉鎖的な姿勢は、AIシステムの堅牢性や安全性をさらに理解しようとする努力を妨げています
  7. 過去1年間、AI研究者と実務者之間で、アルゴリズムの差別などの即時的なモデルリスクと潜在的な長期的存続脅威に関する関心事について多くの議論が行われました。短期リスクの具体性と長期的存続脅威の理論性によって、科学的根拠に基づく主張と政策立案に通知されるべき主張を区別することが難しくなっています。
  8. AIインシデントデータベースによると、AIの誤用に関連するイベントを追跡した結果、2023年に報告されたインシデントは123件で、2022年と比較して32.3%増加しました。2013年以来、AIインシデントは20倍以上に増加しています。顕著な例としては、広範にオンラインで共有されたテイラー・スウィフトを対象としたAI生成の性的なディープフェイク動画があります。
  9. 研究者たちは、ChatGPTがアメリカでは民主党に、イギリスでは労働党に偏っていることを発見しました。この発見は、特に世界的な重要な選挙が行われる年に、このツールがユーザーの政治的意見に影響を与える可能性に対する懸念を引き起こしています。

第四章:経済

  1. 。昨年、全体的な人工知能(AI)のプライベート投資が減少したにもかかわらず、生成型AIへの資金調達額は急増し、2022年からほぼ8倍に増加して252億ドルに達しました。OpenAI、Anthropic、Hugging Face、Inflectionなどの主要企業は大規模な資金調達ラウンドを報告しています。
  2. 。2023年、アメリカのAI投資総額は672億ドルに達し、次点の中国の約8.7倍でした。一方で、2022年以来、中国と欧州連合(英国を含む)のプライベートAI投資はそれぞれ44.2%と14.1%減少したのに対し、アメリカの投資は22.1%増加しました。
  3. 2022年、AI関連の求人はアメリカ全体の求人の中で2.0%を占めていましたが、2023年にはそれが1.6%に低下しました。AI求人の減少は、主要なAI企業による求人発表の減少と、これらの企業内の技術職割合の低下に起因しています。
  4. マッキンゼーの新しい調査によると、42%の回答組織がAI(生成型AIを含む)の実装によりコストが削減され、59%の組織では収益が増加したと報告しています。昨年と比較すると、コスト削減を報告した回答者は10ポイント増加しており、これはAIが著しいビジネス効率の向上をもたらしていることを示しています。
  5. 。世界的プライベートAI投資は2年連続で減少しましたが、2021年から2022年に見られた急減幅よりも小さいものでした。新規に資金を得たAI企業の数は1812社に達し、昨年比で40.6%増加しました。
  6. 。2023年のマッキンゼー報告によると、現在55%の組織が少なくとも1つの事業部門や機能でAI(生成型AIを含む)を使用しており、これは2022年の50%と2017年の20%から増加しています。
  7. 。2013年に日本を追い抜いて世界最大の産業用ロボット設置国となった以来、中国と最接近する競争相手との差は著しく拡大しました。2013年には中国の設置台数は世界全体の20.8%でしたが、2022年にはその割合が52.4%に上昇しました。
  8. 2017年には、協働ロボットはすべての新しい産業用ロボット設置の2.8%しか占めていませんでしたが、この数字は2022年までに9.9%に上昇しました。同様に、2022年には医療ロボット以外のすべての応用カテゴリでサービスロボットの設置数も増加しました。このトレンドは、単にロボットの総設置数が増えているだけでなく、人間向けサービス役割を果たすロボットへの注目度が高まっていることを示しています。
  9. 2023年に実施された複数の研究は、AIが労働力に与える影響を評価し、AIが労働者がより速くタスクを完了し、仕事の質を向上させることを示しました。これらの研究はさらに、AIが低スキルと高スキルの労働者間のスキルギャップを縮める可能性があることも示しました。しかし、他の研究は、適切な規制なしにAIを使用するとパフォーマンスが低下する可能性があると警告しています。
  10. 2023年には、394回の収益電話会議でAIが言及され(これはフォーチュン500に含まれる企業の約80%に相当します)、2022年の266回と比べて顕著に増加しました。2018年以来、フォーチュン500企業の収益電話会議でのAIに関する言及はほぼ倍増しています。その中で最も頻繁に取り上げられたトピックは生成型AIであり、すべての電話会議の19.7%を占めています。

第五章:科学と医学

  1. 2022年、AIが科学的発見を促進し始めました。2023年には、アルゴリズムのソート効率を向上させるAlphaDevから、材料発見を支援するGNoMEまで、より多くの重要な科学関連AIアプリケーションが登場しました。
  2. 2023年には、EVEscape(疫病予測能力を強化)やAlphaMissence(AI駆動の突然変異分類を支援)など、いくつかの重要な医療システムが導入されました。AIはますます医療の進歩を推進するために使用されています。
  3. 過去数年間で、AIシステムはMedQAベンチマークテストにおいて顕著な改善を見せています。これはAIの臨床知識を評価する重要なテストです。2023年の優秀なモデルであるGPT-4 Medpromptの精度は90.2%に達し、2022年の最高スコアより22.6ポイント向上しました。2019年にこのベンチマークが導入されて以来、AIのMedQAにおけるパフォーマンスはほぼ3倍に増加しています。
  4. 2022年には、FDAが139のAI関連医療機器を承認しました。これは2021年と比較して12.1%の増加です。2012年以来、FDAが承認したAI関連医療機器の数は45倍以上に増加しています。AIはますます実際の医療用途に使用されるようになっています。

第六章:教育

  1. 過去十数年間にわたり、アメリカとカナダのコンピュータサイエンス学士号取得者の数は増加を続けていますが、修士号や博士号を目指す学生の数は横ばい傾向にある。2018年以来、コンピュータサイエンスの修士および博士号取得者の数は若干減少している。
  2. 2011年には、新規AI博士課程修了者のうち、産業界(40.9%)と学界(41.6%)を選ぶ割合はほぼ同じであった。しかし2022年には、博士課程修了者の大部分(70.7%)が産業界に就職し、学界を選んだのは20.0%に過ぎなかった。過去1年間だけで、産業界に進むAI博士課程修了者の割合は5.3ポイント増加しており、大学から産業界への人材流出がさらに強まっていることが示されている。
  3. 2019年には、アメリカとカナダの新しいAI教師の13%が産業界から来ていた。2021年にはこの数字が11%に減少し、2022年にはさらに7%まで低下した。この傾向は、高度なAI人材の産業界から学界への移動が徐々に減少していることを示している
  4. 2022年には、国際的なコンピュータサイエンスの学士、修士、博士号取得者の割合が2021年よりも減少しており、特に修士課程における国際学生の減少が顕著だった
  5. 2022年には、APコンピュータサイエンス試験が20万1千回実施されました。2007年以来、これらの試験を受けた学生の数は10倍以上に増加しています。しかし、最近の証拠によると、大規模な高校や郊外の学校に通う学生の方がコンピュータサイエンスコースにアクセスできる可能性が高いことが示されています。
  6. 2017年以来、英語で提供されるAI関連の高等教育の学位課程の数は3倍に増加しており、過去5年間で毎年安定して増加しています。世界中の大学が、AIを重点とした学位課程をさらに提供しています。
  7. イギリスとドイツは、ヨーロッパにおける情報学、コンピュータサイエンス、コンピュータ工学および情報技術の学士、修士、博士号取得者の数においてリードしています。人口あたりで計算すると、フィンランドが学士号と博士号の取得者生産で最も多く、アイルランドが修士号の取得者生産で最も多くなっています。

第七章:政策とガバナンス

  1. 。過去1年間および過去5年間で、アメリカのAI関連規制の数は顕著に増加しました。2023年にはAI関連規制が25件に達し、2016年のわずか1件から大幅に増加しました。昨年だけで、AI関連規制の総数は56.3%増加しました。
  2. 。2023年、大西洋两岸の政策立案者はAI規制を進めるための重大な提案を行いました。欧州連合は、2024年に公布される予定の画期的な立法であるAI法の条項について合意しました。一方で、バイデン大統領は、その年にアメリカで最も注目されたAI政策イニシアチブであるAIに関する大統領令に署名しました。
  3. 2023年、連邦レベルでのAIに関する立法提案が顕著に増加し、提出された法案の数は2022年の88件から181件へと倍以上に増加しました。
  4. 世界中の立法手続きでAIが言及される回数がほぼ倍増し、2022年の1,247回から2023年には2,175回に増加しました。2023年には、合計49カ国の立法手続きでAIが言及されました。さらに、2023年には各大陸で少なくとも1つの国がAIについて議論しており、これはAI政策に関する議論の世界的な影響を示しています。
  5. 2023年にAI規制を発表したアメリカの規制機関の数は、2022年の17か機関から21か機関に増加し、ますます多くのアメリカの規制機関がAI規制に関心を持っていることが示されています。2023年に初めてAI関連の規制を作成した新しい規制機関には、運輸省、エネルギー省、労働安全衛生局が含まれます。

第八章:多様性

  1. 白人学生が依然として学士号、修士号、博士号の各レベルで新卒者の最大割合を占めているものの、アジア系、ラテン系、黒人またはアフリカン・アメリカン系学生などの他の人種グループの割合も増加しています。例えば、2011年以来、アジア系のコンピュータサイエンス学士号取得者の割合は19.8ポイント増加し、ラテン系学士号取得者の割合は5.2ポイント増加しました。
  2. 調査対象のすべてのヨーロッパの国々では、情報学、コンピュータ科学、コンピュータ工学、および情報技術の学部、修士号、博士号プログラムにおいて、男性卒業者の数が女性卒業者を上回っていると報告されています。過去10年間でほとんどの国の性差は縮小していますが、そのペースは遅いです。
  3. APコンピュータサイエンス試験に参加する女子学生の割合は、2007年の16.8%から2022年には30.5%に増加しました。同様に、アジア系学生、ヒスパニック/ラテン系学生、そして黒人/アフリカ系アメリカ人学生のAPコンピュータサイエンス受験者の割合も年々安定して増加しています。

第九章:世論

  1. アイピソスの調査によると、過去1年間でAIが今後3~5年以内に自分の生活に大きな影響を与えると考える人の割合は60%から66%に増加しました。さらに、AI製品やサービスに懸念を示す人は52%で、2022年と比べて13ポイント上昇しています。アメリカでは、ピュー研究所のデータによると、AIに対する懸念が期待感を超えるようになった人が52%となり、これは2022年の38%から上昇した数値です。
  2. 2022年には、ドイツ、オランダ、オーストラリア、ベルギー、カナダ、アメリカなどいくつかの先進国が、AI製品やサービスに対して最も消極的な姿勢を見せていました。それ以来、これらの国々すべてにおいて、AIの利点を認識する回答者の割合が上昇しており、その中でもオランダでの変化が特に顕著です。
  3. アイピソスの調査において、自身の仕事においてAIが改善をもたらすと考える回答者はわずか37%でした。また、AIが経済を促進すると予想する人は34%、雇用市場を改善すると考える人は32%に留まっています。
  4. 生活水平の向上に関するAIの潜在的可能性について、世代間で顕著な人口統計的な違いが存在する。若年層は一般的により楽観的である。例えば、Z世代の6割がAIが娯楽選択を改善すると考えている一方で、ベビーブーム世代ではその割合は4割にとどまる。さらに、収入や教育レベルが高い人々は、娯楽、健康、経済におけるAIのポジティブな影響に対してより楽観的であり、低所得および低学歴の同年代の人々と比較してその傾向が見られる。
  5. トロント大学の国際調査によると、回答者の63%がChatGPTを認識している。このうち、半数近くの人が少なくとも週に一度ChatGPTを使用していると報告している。