
https://hai.stanford.edu/assets/files/hai_ai_index_report_2025.pdf
経営者の皆様こんにちは。
日々の意思決定において、AIの進化が自社の競争力、そして未来の成長にどう影響するか、その最前線の動向を把握することは不可欠です。上記リンクは、スタンフォード大学AI Indexが発行した最新の「AI Index Report 2025」は、AIがもはや単なる技術トレンドではなく、社会、経済、そしてガバナンスの中核を担う存在へと変貌を遂げていることを明確に示しています。
この包括的なレポートは、AIハードウェアの進化、推論コストの新しい推定値、AI関連の論文・特許トレンド、責任あるAI(RAI)の企業導入に関する新鮮なデータ、さらには科学・医療分野におけるAIの役割の拡大など、多岐にわたる詳細な分析を提供しています。本記事では、この膨大な情報の中から、特に皆様の事業戦略に直結する重要なインサイトを厳選し、深掘りして解説いたします。

AIの進化は想像をはるかに超えるスピードで進んでおり、その実用化が加速しています。特に注目すべきは、AIモデルの性能向上と、それにかかるコストの劇的な低減です。
AIモデルの推論(実行)コストは、ここ数年で驚くほど低下しています。2022年11月には、GPT-3.5と同等の性能を持つモデルの推論コストが100万トークンあたり20.00ドルであったのに対し、2024年10月にはGemini-1.5-Flash-8Bでわずか0.07ドルへと、約18ヶ月で280倍以上もの削減を達成しました。これは、大規模言語モデル(LLM)の推論価格が年間で9倍から900倍も下落していることを意味し、AIを広範なサービスに低コストで組み込むことが可能になっていることを示唆しています。
さらに、AIモデルの小型化と高性能化も顕著です。2022年には5,400億パラメータを持つPaLMがMMLU(大規模多言語理解)ベンチマークで60%以上のスコアを記録しましたが、2024年にはわずか38億パラメータのMicrosoftのPhi-3-miniが同等の閾値を達成しました。これは2年間でモデルサイズが142分の1に縮小したことを意味し、より少ないリソースで高い性能を発揮できる可能性を示しています。これにより、エッジデバイスやモバイル機器でのAI活用も現実味を帯びてきています。
AIエージェントの能力向上も目覚ましいものがあります。RE-Benchという新しいベンチマークでは、短期間(2時間)の作業において、トップAIシステムが人間の専門家より4倍高いスコアを記録し、特定のタスクで人間の専門知識に匹敵するか、それを超える結果をより速く、より低コストで提供し始めています。これは、AIが単なるツールから、自律的にタスクを遂行する「エージェント」へと進化していることを示しています。
また、テキストから高品質な画像や動画、音声、さらには楽曲を生成する能力も飛躍的に向上しています。OpenAIのSORA、MetaのMovie Gen、Google DeepMindのVeo 2といった主要モデルが2024年にリリースされ、2023年と比較して動画生成の品質が著しく向上しています。これにより、コンテンツ制作やマーケティングなど、クリエイティブな分野でのAIの活用が本格化しています。
AIを支えるハードウェアも進化を続けており、エネルギー効率は年間約40%向上しています。Nvidia B100は2016年のP100と比較して33.8倍もエネルギー効率が高いと報告されています。しかしながら、最先端のAIシステムをトレーニングするために必要な総電力消費量は依然として急増しており、例えば、2024年夏にリリースされたLlama 3.1-405Bは、2017年のTransformerモデルの5,000倍以上の電力を必要としました。この膨大なエネルギー消費は、今後のAI開発における重要な課題となるでしょう。
中国のAI技術性能も急速に米国に追いついています。LMSYS Chatbot Arenaのデータによると、2024年1月には米国のトップモデルが中国のベストモデルを9.3%上回っていましたが、2025年2月にはその差がわずか1.7%に縮まりました。DeepSeekのV3モデルのように、少ないハードウェアリソースで高い性能を達成する事例も出ており、米国の半導体輸出規制の効果に疑問符がつけられています。

AI分野への投資は堅調に推移しており、特に生成AIへの注目が際立っています。
2024年には、生成AIセクターに339億ドルもの資金が投入され、これは2023年比で18.7%増加、2022年比では8.5倍以上に達しました。この生成AIセクターは、2024年のAI関連プライベート投資全体の20%以上を占めています。
AI関連のプライベート投資イベントの平均規模も、2023年の3,160万ドルから2024年には4,540万ドルへと大幅に増加しました。特に、2024年には10億ドルを超える大型投資イベントが15件発生しています。このような大型投資は、この分野の成熟と将来性への期待の表れと言えるでしょう。
総投資額と新規設立されたAI企業の数において、米国が引き続き世界をリードしています。2024年、米国のプライベートAI投資は1,091億ドルに達し、これは中国の93億ドルの約12倍、英国の45億ドルの約24倍にあたります。生成AI分野ではさらにその差が顕著で、米国の投資額は中国とEU+英国の合計を254億ドルも上回っています。
AI研究開発の中心は、これまでアカデミアが主導してきましたが、近年は産業界が顕著に多くのNotable AI Modelsをリリースしています。特にパラメータ数の多い大規模モデルは、そのトレーニングに必要な膨大な計算資源と資金力から、ほとんどが産業界から生まれています。
AIを活用している企業の多くは、事業機能においてコスト削減や収益増加といった財務的なメリットを報告しています。例えば、サービス運用でコスト削減を報告した企業の49%、サプライチェーン管理では43%、ソフトウェアエンジニアリングでは41%がコスト削減を実現しました。しかしながら、大半の企業は、その効果はまだ「低いレベル」にあると認識しており(コスト削減は10%未満、収益増加は5%未満が最も一般的)、AI導入による本格的な事業インパクトはこれからという状況です。2024年には、少なくとも1つの事業機能で生成AIを使用している企業の割合が71%に達し、2023年の33%から倍増しています。

AIは仕事のやり方を根本から変えるという認識が広がる一方で、雇用喪失への懸念は比較的低い水準に留まっています。
世界の回答者の60%が、今後5年以内にAIが仕事のやり方を変えると予想しているものの、自分の仕事がAIに置き換えられると考える回答者は36%に留まっています。むしろ、55%がAIによって物事をこなす時間が短縮されると信じており、生産性向上への期待が高いことが伺えます。
2024年の米国のAI関連求人では、「SQL」「データ分析」「コンピューターサイエンス」「Python」といった専門スキルがトップ10にランクインしています。AIスキルを持つ人材の獲得競争は激化しており、企業はこれらのスキルを持つ従業員の育成や採用に力を入れる必要があるでしょう。
AI人材の国際的な流動も活発です。LinkedInのデータによると、ルクセンブルク、キプロス、アラブ首長国連邦が人口10万人あたりのAI人材の純流入が最も大きい国となっています。これは、これらの国がAI分野の成長ハブとして、世界中から才能を引き寄せていることを示唆しています。
医療分野では、AIが診断推論で単独で医師を上回る性能を示すことがありますが、実際のワークフローへの統合にはまだ課題があります。しかし、AIを活用した医療書記技術は、医師の電子カルテ作業時間を大幅に削減し、燃え尽き症候群の軽減に貢献していることが報告されています。これは、AIが特定の職種を完全に代替するよりも、多くの職種において「増強(オーグメンテーション)」の役割を果たす可能性が高いことを示しています。

AIの普及に伴い、その安全性、公平性、透明性といった「責任あるAI(RAI)」に関する議論が重要性を増しています。
2024年には、AIガバナンスにおける国際協力が強化され、OECD、EU、国連、アフリカ連合などの主要機関が責任あるAIの原則に関する枠組みを発表しています。例えば、EUは初の包括的なAI規制枠組みである「EU AI Act」を可決し、リスクに応じてAIを分類し、高リスクシステムにはプロバイダーが多くの義務を負うよう定めています。また、米国はオーストラリア、カナダ、日本、シンガポール、英国などと国際AI安全研究所ネットワークを立ち上げ、AI安全性のグローバルな調整を強化しています。
企業はAI関連のリスクとして、サイバーセキュリティ(66%)、規制遵守(63%)、個人情報保護(60%)を主要な懸念事項として認識しています。しかし、これらのリスクに対する具体的な緩和努力は、認識に追いついていない現状が浮き彫りになっています。多くの組織はAIリスクの特定や監視、制御を改善し、AIリスク管理への「組織的成熟度」を高めていますが、バイアス削減や敵対的テストといった「運用的成熟度」は遅れています。このギャップは、高レベルのコミットメントと技術的な実装の間の課題を示しています。
AIモデルのトレーニングに不可欠な公開ウェブデータの利用制限が、2023年から2024年にかけて大幅に増加しました。多くのウェブサイトがAIトレーニングのためのデータスクレイピングを制限する新しいプロトコルを導入したため、C4コモンクロールデータセットのアクティブに維持されているドメインでは、制限されたトークンの割合が5〜7%から20〜33%に跳ね上がりました。これは、データの多様性、モデルの整合性、スケーラビリティに影響を与え、データ制約下での新しい学習アプローチが必要となる可能性を示唆しています。
AI企業が個人データを保護するという信頼は、2023年の50%から2024年には47%に低下しており、AIシステムの公平性や差別からの自由に対する信頼も低下しています。
AIの悪用によるインシデントも報告されています。例えば、2024年6月には、15歳の学生がディープフェイクのヌード画像で嫌がらせを受け、2024年10月には、AIチャットボットが故人の身元を無断で使用するという事案が発生しました。また、2024年の選挙期間中には、AIによって生成された誤情報が拡散される事例が複数報告されています。メキシコではAI生成のスターバックスのカップ画像が政治的キャンペーンに利用され、インドではAIを活用した個別化された選挙動画が拡散、ウルグアイではAIホログラムを使った「ありえない討論会」が放映されました。米国では中国発の「スパマージュ」キャンペーンがAI画像を悪用し、南アフリカではAI生成の道路の穴の画像が選挙に影響を与えようとしました。これらの事例は、AIの倫理的な側面への対処が喫緊の課題であることを示しています。
幸いにも、自律走行車に関しては、Waymo社のデータが人間が運転する車両と比較して、事故発生率が著しく低いことを示しており、AIの安全性が実証されるポジティブな側面も存在します。

AIは、科学、医療、教育といった多岐にわたる分野で、新たなブレイクスルーを生み出しています。
医療分野では、Google DeepMindのAlphaProteoが、がんや糖尿病に関連するタンパク質に対して、既存の最先端ソリューションよりも最大300倍も効果的な新しいタンパク質結合剤を設計するなど、画期的な進歩を遂げています。Nvidia Tel AvivとWeizmann Instituteなどが開発したGluFormerは、連続血糖値モニタリング(CGM)データを分析し、最大4年先の健康状態を予測することで、糖尿病ケアを事後対応から予防へとシフトさせる可能性を秘めています。
さらに、AIが生成した合成データは、プライバシーを保護しながら臨床リスク予測の精度を高め、創薬のプロセスを加速させるなど、医療分野に革命をもたらしています。これらの進歩は、患者ケアの質を向上させるだけでなく、医療研究の効率化にも貢献しています。
医療分野におけるLLM(大規模言語モデル)の活用も進んでおり、UC Santa Cruz、University of Edinburgh、NIHの研究では、新しいo1モデルを含むLLMが様々な医療データセットで性能を向上させていることが示されました。特に、AIによる医療書記は、医師の電子カルテ作業時間を大幅に削減し、医師の燃え尽き症候群の軽減に貢献しています。
AIの応用は医療にとどまりません。地球科学分野では、Auroraモデルが地球システムデータを活用して空気品質、海洋波、サイクロントラック、高解像度気象の予測を最先端の精度で提供し、従来のシステムよりもはるかに低い計算コストで動作します。Google DeepMindのGenCastは、拡散ベースのアプローチを用いて15日間の高精度な気象予測を数分で生成し、災害対応、再生可能エネルギー、農業など幅広い分野での応用が期待されています。
量子コンピューティングの分野でも、Google DeepMindとGoogle Quantum AIがAlphaQubitを発表し、最先端の量子エラー検出機能を持つAIベースのデコーダを実現しました。さらに、Willowという量子チップは、最も高速なスーパーコンピューターが700垓年(宇宙の年齢よりも長い時間)かかるベンチマークタスクを5分未満で完了させ、指数関数的なエラー抑制と補正を達成しました。
教育分野では、世界の3分の2の国がK-12(幼稚園から高校まで)のコンピュータサイエンス(CS)教育を提供しているか、計画していると報告されており、これは2019年の2倍にあたります。特にアフリカとラテンアメリカで最も大きな進展が見られます。米国では、過去10年間で計算機科学の学士号取得者が22%増加しましたが、アフリカ諸国では電力などの基本的なインフラ不足により、アクセスが依然として制限されています。米国では、K-12のCS教師の81%がAIが基礎的なCS教育の一部となるべきだと考えていますが、AIを教える準備ができていると感じている教師は半数以下です。
「AI Index Report 2025」は、AIが指数関数的な進化を続け、私たちの社会とビジネスに深く浸透している現状を浮き彫りにしています。推論コストの劇的な低下は、これまで導入をためらっていた企業にもAI活用への扉を開き、AIエージェントや小型高性能モデルの出現は、さらなる業務効率化と新たな価値創造の可能性を示しています。
一方で、データ利用の制限や、AIの倫理的側面への社会の懸念は、経営者が戦略的に取り組むべき重要な課題です。単にAIを導入するだけでなく、その「使い方」や「倫理的な配慮」が、企業の競争優位性を左右する時代が到来しています。
貴社の未来の成長戦略において、AIをいかに活用し、いかに責任ある形で展開していくか。 本レポートは、その問いに対する深い洞察と具体的なデータを提供しています。ぜひ本レポートを読み解き、貴社のAI戦略を再考する機会としてご活用ください。
- Q: 「AI Index Report 2025」はどのようなレポートですか?
- A: 「AI Index Report 2025」は、スタンフォード大学の「AI100(One Hundred Year Study on Artificial Intelligence)」研究の一環として作成されたレポートで、AIの動向を追跡することを目的としています。Emily Capstick氏、Malou van Draanen Glismann氏、Njenga Kariuki氏、そして学部生研究者などが執筆に携わっています。
- Q: 近年、AIモデルの性能にはどのような顕著な変化が見られますか?
- A: クローズドウェイトモデルとオープンウェイトモデルの性能差が大きく縮小しています。2024年1月にはクローズドウェイトモデルがオープンウェイトモデルを8.0%上回っていましたが、2025年2月にはその差がわずか1.7%にまで縮まりました。この改善は、MetaのLlama 3.1やDeepSeekのV3のような高性能なオープンウェイトモデルの登場が主な要因です。
- また、より小規模なモデルが高性能を発揮する傾向も顕著です。例えば、2022年に大規模マルチタスク言語理解(MMLU)ベンチマークで60%を超えた最小のモデルはPaLM(5,400億パラメータ)でしたが、2024年にはMicrosoftのPhi-3 Mini(38億パラメータ)が同じしきい値を達成し、モデルサイズが142分の1に削減されました。
- Q: AIのベンチマーク評価にはどのような課題がありますか?
- A: MMLU、GSM8K、HumanEvalといった従来のAIベンチマークの多くは飽和状態に達しており、進化するAIシステムの能力を十分に評価しきれないという課題に直面しています。このため、研究者はより専門的で難易度の高いMMMU、GPQA、Humanity’s Last Exam、FrontierMathといった新しい評価方法を継続的に提案しています。
- Q: 画像・動画生成AIの進歩は?
- A: 2024年には、AIシステムがVisual Commonsense Reasoning (VCR) ベンチマークで人間のベースライン(85.0%)に到達しました。また、OpenAIのSoraをはじめ、Pika、RunwayのGen-3 Alpha、LumaのDream Machine、KuaishouのKling 1.5など、複数の主要な産業プレイヤーが動画生成システムにおいて著しい進歩を遂げています。
- Q: 2024年にAIガバナンスに関してどのような動きがありましたか?
- A: 2024年には、責任あるAI(RAI)に関する国際協力が大幅に強化されました。OECD、欧州連合、国連、アフリカ連合などの主要組織が、透明性、説明可能性、信頼性といった主要なRAIの懸念事項に関するフレームワークを発表しています。
- さらに、世界中でAI安全機関が設立され、2024年5月のAIソウルサミットでは、日本、フランス、ドイツ、イタリア、シンガポール、韓国、オーストラリア、カナダ、欧州連合でも追加の機関設立が公約されました。同年11月には、世界9カ国とEUが参加する国際AI安全機関ネットワークが正式に発足しています。
- Q: 各国の立法府におけるAIに関する議論は増加していますか?
- A: はい、その傾向は顕著です。世界75の主要国における立法審議でのAIに関する言及は、2024年に21.3%増加し、2023年の1,557件から1,889件になりました。2016年以降、AIに関する言及総数は9倍以上に増加しています。2024年にはスペインが314件と最も多くのAI関連言及を記録し、アイルランド(145件)、オーストラリア(123件)が続きました。
- Q: AIモデルのトレーニングデータにはどのような懸念がありますか?
- A: AIモデルが大量の公開ウェブデータに依存している一方で、「データコモンズ」が急速に縮小しています。2023年から2024年にかけて、多くのウェブサイトがAIトレーニングのためのデータスクレイピングを制限する新しいプロトコルを導入したため、データ利用制限が大幅に増加しました。C4共通クロールデータセットにおける制限付きトークンの割合は、5~7%から20~33%に急増しています。このデータ不足は、データ多様性、モデルアライメント、スケーラビリティに影響を与え、データ制約下での新しい学習アプローチを促す可能性があります。Epoch AIの研究チームは、現在のトレーニングデータは2026年から2032年の間に完全に使い果たされると予測しています。
- Q: AI研究論文の傾向は?
- A: 学術機関がAI論文の主要な情報源であり、2023年には全体の84.9%を占めました。最も盛んな研究トピックは機械学習(75.7%)で、コンピュータビジョン(47.2%)、パターン認識(25.9%)、自然言語処理(17.1%)が続きます。特に、過去1年間で生成AIに関する論文が急増しました。
- Q: AI関連の求人需要は?
- A: 米国では、2023年から2024年にかけて、公共行政を除くほぼすべての部門でAI関連の求人掲載の割合が増加しました。特に需要が高かったAIスキルは「人工知能」(0.9%)、これに続く「機械学習」(0.9%)、そして「自然言語処理」(0.23%)でした。州別では、カリフォルニア州が全AI求人掲載の15.7%を占め、テキサス州(8.8%)、ニューヨーク州(5.8%)が続きました。
- Q: AI関連の投資動向は?
- A: 2024年には、AIプライベート投資案件の平均規模が2023年の3,160万ドルから4,540万ドルへと大幅に増加しました。また、10億ドルを超える資金調達を伴うAIプライベート投資案件が15件ありました。最も多くの投資を集めたのはAIインフラ/研究/ガバナンス分野で、373億ドルに達しました。
- Q: 産業用ロボットの導入状況は?
- A: 中国は産業用ロボットの導入において支配的な地位を維持しており、2023年には276,300台の産業用ロボットを設置しました。これは日本と比較して6倍、米国と比較して7.3倍の台数です。世界の総設置台数に占める中国の割合は51.1%に達しています。
- Q: 責任あるAI(RAI)に関する倫理的側面は?
- A: 医療AIの倫理に関する出版物の数は、2020年から2024年の間に4倍に増加し、1,031件に達しました。2024年において、これらの出版物で最も頻繁に言及された倫理的懸念は「バイアス」と「プライバシー」でした。
- Q: AIに対する一般市民の意見は?
- A: 2024年の調査では、世界全体でAI製品やサービスに「神経質になっている」と答えた人が67%に達し、一方で「興奮している」と答えた人は53%でした。中国ではAIに対する認識、信頼、興奮度が高い一方、英国、米国、カナダ、オーストラリア、ニュージーランドなどのアングロサクソン諸国では神経質になる傾向がより高く、興奮度が低いという対照的な傾向が見られました。
- 2022年から2024年にかけて(ChatGPTの登場以降)、AIを搭載した製品やサービスが日常生活を「大きく変える」という世界的な認識は11%増加しました。同時に、AI製品やサービスに「神経質になっている」という意見も世界的に11%増加しています。
AIによる効率化などもお手伝い可能なDFEにバックオフィスをお任せください。
お問い合わせは下記から
contact@dfe-jp-com