2025年10月06日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
GPT-5 Proが難解な数学問題を解明、AIインフラ大規模投資も加速
今週のAI業界は技術的ブレークスルーとインフラ投資の加速が目立ちます。GPT-5 Proが「解けない」とされていた数学難問を解読し、数理能力の進化を示しました。
一方でOpenAIの巨大データセンター計画は総額5,000億ドル規模に拡大の可能性があり、週間10億ユーザー獲得を目指すなど野心的な展開が続いています。
Cursorの超高速モデル「cheetah」登場やMicrosoftのExcel AIエージェントの進化など、実用面での進展も著しい一方、放射線医学では専門医にAIが大敗するなど課題も見えています。
それでは各トピックの詳細に目を向けていきましょう。
目次
- GPT-5 Pro、数学の超難問「Yu Tsumura’s 554th Problem」を解読
- Cursorに謎の超高速モデル「cheetah」が登場
- OpenAI巨大DC計画続報、総投資額5000億ドル規模か
- MSのExcel AIエージェント、複雑な既存ファイルも操作可能に【続報】
- xAI、Grok版Wikipedia「Grokpedia」2週間以内に公開【続報】
- Geminiのトラフィックシェア23%に急増、ChatGPTは55%に減少
- Apple、次期CEO候補を立てAI責任者探しに着手
- Samsung製HBM3E、NVIDIAへの量産供給を開始と報道【続報】
- 放射線医学ベンチマークでAIが専門医に大敗
GPT-5 Pro、数学の超難問「Yu Tsumura’s 554th Problem」を解読
- GPT-5 Proの驚異的な数学的能力を示す新たな報告です。
- これまでどのLLMも解けなかったとされる数学の難問「Yu Tsumura’s 554th Problem」を、インターネット検索なしで約14分で解いたと報告されました。
- この問題は、オックスフォード大学とケンブリッジ大学の研究者が「LLMには解けない」と主張していたもので、事実であればAIの数学的推論能力が新たな段階に到達したことを示す画期的な出来事となります。
Rohan Paul: (翻訳) 🫡 GPT-5-Proが、他のどのLLMも解けなかった数学の問題を解きました。インターネット検索なしで14分かかりました。 オックスフォード大学とケンブリッジ大学の論文では、「津村ゆうの554番目の問題」をLLMは解けないと主張していました。 OpenAIのGPT-5 Proは、約14分で完全な証明を作成しました。 https://t.co/AB3iBi9u26
Cursorに謎の超高速モデル「cheetah」が登場
- コーディング支援AIツール「Cursor」に、圧倒的な速度を誇る新しいステルスモデル「cheetah」が登場し話題となっています。
- 数十行から100行程度のコードを数秒で生成するとの報告があり、その速度はGroqのAPIを彷彿とさせるとの声も上がっています。
- 価格設定がGPT-5と似ていることから、GPT-5のチェックポイントや、Gemini 3 Proの早期バージョンではないかといった憶測が飛び交っています。
まつにぃ: 早速Cursorのステルスモデル「cheetah」を触ってみた。 50~100行とかを2~3秒とかで仕上げてきており、早すぎんか?ってなりました。 結構プロンプト通りに忠実に動いているし、これはGemini Flash 3かHaiku 4.5か。その辺の空気も感じます。 Groqみたいな速度。 https://t.co/SKzLWOVDtS
Kol Tregaskes: (翻訳) Cursorに新しいステルスモデル「cheetah」が登場。 Gemini 3 Pro? 新しいGPT-5? アップデートされたGrok Code? どう思いますか? 費用は入力100万トークンあたり1.25ドル、出力100万トークンあたり10ドルです。 https://t.co/fNk84jeqek
Ian Nuttall: (翻訳) cursorのチーターステルスモデルはgemini 3の初期バージョンですか? 入力100万あたり1.25ドル+出力100万あたり10ドルはそうかもしれません 約20分後のチーターの第一印象は次のとおりです。 - 驚くほど速く、別次元の速さです - UIは非常に優れているようですが、 https://t.co/ktmihK2eDB
OpenAI巨大DC計画続報、総投資額5000億ドル規模か
- JP Morganのレポートによると、OpenAIが進めるAIデータセンター計画の総投資額が約5,000億ドルに上る可能性があると報じられました。
- これは4年以内に総容量10GWの施設を構築するもので、以前報じられた計画を上回る規模です。
- また、年末までに週次10億ユーザーの獲得を目指し、2025年上半期に20億ドルを営業・マーケティングに投入する計画も明らかになり、事業拡大を加速させています。
パウロ: これは...凄まじいメモリの需要 OpenAIの積極的なAIインフラ拡張によるアジアの半導体およびサーバー供給チェーンの受益者分析(JPM) ⸻AIインフラ投資規模と市場影響 • OpenAIは、4年以内に総容量10GWのAIデータセンターを構築する計画で、総投資額は約5,000億米ドル。 •
パウロ: OpenAI 週次10億人ユーザーを年末までに目指す 営業とマーケティングに20億ドル投入
Jukan: (翻訳) JPMのOpenAIフードチェーン表 https://t.co/364YBb6NPs
MSのExcel AIエージェント、複雑な既存ファイルも操作可能に【続報】
- 以前お伝えしたMicrosoftのExcel向けAIエージェント機能の続報です。Excelのアドオン「Excel Labs」に搭載されたAIエージェントが、非常に強力だと話題になっています。
- この機能は、既存業務で使われている複雑なフォーマットのExcelファイルをそのまま読み込み、AIが内容を理解して操作できると報告されています。
- 将来的には図や画像も認識可能になるとみられており、WordやPowerPointへの展開も期待されています。
まつにぃ: 多分MSのOffice Agentはガチでちゃんと見てないと横からぶん殴られるレベルだと思います。 現状のExcelAgentも3時間触り続けましたがかなり強力です。 これがWordやPPTXにも載ってくると相当強いし、それを統合するAgentなんて来ようもんなら人類総MS回帰な気がしてなりません。 ガクブルですよ。
まつにぃ: 多分一番やばい要素として、Excel AgentでJTC会みんなで声揃えて「これ今の業務やフォーマットのまま移行しそうやね」ってところでした。 AI Agentってなんだかんだ構造化なりなんなり必要で障壁ありましたが、多分この辺全てそのままで掻っ攫いに来ますよ。 Excelも図や画像全部拾う様になります。
まつにぃ: Excel Agentをお試ししたい方は会社のアカウントか個人アカウントで以下の設定を行えば試せます。 アカウント契約→Excelアドオン追加「Excel Labs」→Agent Mode選択 Office Agentの片鱗を味わえますので、どうぞ ※パーソナルプランでも可能 https://t.co/XNaAsEGTmk
xAI、Grok版Wikipedia「Grokpedia」2週間以内に公開【続報】
- 以前噂として報じられた、xAIによるGrok版Wikipedia「Grokpedia」のベータ版が2週間以内にリリースされることが正式に発表されました。
- このサービスは「イデオロギーではなく、真実のみに基づく」データベースを目指すとしています。
- また、Grokの画像生成機能「Grok Imagine」も品質が向上したと報告されており、xAIのサービス展開が加速しています。
Tech Dev Notes: (翻訳) イーロンによると、Grok版ウィキペディアは「2週間後」にリリースされる予定です。バージョン0.1
Chubby♨️: (翻訳) これは興味深いかもしれません。2週間後、xAIは「イデオロギーではなく、真実のみに基づく」データベース「Grokpedia」をリリースします。 哲学では、イデオロギーという用語は物議を醸しており、非イデオロギー的な世界自体がイデオロギーです。この点に関して、私は上記を引用符で囲みました。 https://t.co/7MQC56itAo
パウロ: Grokもアップデートきたぁ
Geminiのトラフィックシェア23%に急増、ChatGPTは55%に減少
- これまでアプリのダウンロード数などでのユーザー増が報じられてきたGoogleのGeminiについて、新たにトラフィックシェアでも急増していることが明らかになりました。
- 1年前はChatGPTが87.1%と圧倒的でしたが、直近では54.9%に減少する一方、Geminiは23.1%までシェアを伸ばしています。
- このデータは、Geminiの性能向上とGoogle検索との連携により、多くのユーザーがGoogleのエコシステムに回帰している可能性を示唆しています。
rindai87: 感覚値と実測値の両方を大事にしないとなぁと思わせてくれる
Rohan Paul: (翻訳) @Google Geminiの離陸速度は驚くべきものです。そして、AIを活用した検索結果はユーザーをGoogle検索に引き戻しています。今や、Googleが常にこのAIの時代のために作られてきたことは明らかです。https://t.co/I6aLHc8B5G
Apple、次期CEO候補を立てAI責任者探しに着手
- Bloombergの報道によると、Appleはハードウェア部門責任者のJohn Ternus氏を次期CEOの有力候補と位置づけている模様です。
- 同時に、新たなAI責任者も探しており、経営体制とAI戦略の両面で強化を図る動きと見られています。
- また、Appleは強化学習でモデルのハルシネーションを特定する技術論文も発表しており、研究開発も活発化しています。
Mark Gurman: (翻訳) パワーオン:Appleの事業承継計画の内部。同社は次期CEOとしてハードウェア部門の責任者であるジョン・ターナス氏に注目を強めており、複数の幹部が退職について話し合い、新しいAI責任者を探しています。https://t.co/fIGNw4VfiT
Rohan Paul: (翻訳) Appleはここ数日、素晴らしい論文をたくさん発表しています。🔥 この論文では、強化学習を用いてモデルを訓練し、回答の幻覚部分を正確にマークします。 ここで重要なのは、モデルが単にフラグを立てるだけでなく、正確な偽のテキストを指し示すようにすることです。https://t.co/XppnCyXZmY
Samsung製HBM3E、NVIDIAへの量産供給を開始と報道【続報】
- 以前、NVIDIAの品質テスト通過が報じられていたSamsungのHBM3Eに関する続報です。
- 韓国メディアが、SamsungはNVIDIAからの受注を受け、12層HBM3Eの量産供給を開始したと報じました。
- AIサーバーに不可欠なHBMの供給安定化に繋がるか、今後の動向が注目されます。
Jukan: (翻訳) サムスンがNVIDIAの12層HBM3Eの最終認定試験に合格。 韓国の地元メディアの報道によると、サムスンはNVIDIAから12層HBM3Eの注文を受け、量産供給を開始した。 $NVDA
パウロ: 生成AIにより、先端プロセス、先端パッケージング、HBM/DRAMの需要が爆発 TSMC, Samsung, SK Hynix, Micronが最初の受益者ですね
放射線医学ベンチマークでAIが専門医に大敗
- 新たに公開された放射線医学のベンチマーク「Radiology’s Last Exam」で、最先端のAIモデルが人間の専門医に大きく及ばない結果となり、医療分野におけるAIの現状と課題が浮き彫りになりました。
- このベンチマークでは、認定放射線科医が83%の正答率を記録したのに対し、最も性能が高かったGPT-5でも正答率は30%にとどまりました。
- この結果は、専門的な医療診断のような高度なタスクにおいては、「医師レベル」のAI実現にはまだ距離があることを示唆しています。
Chubby♨️: (翻訳) 放射線科の最終試験:人間の放射線科医は約83%の精度を達成しましたが、GPT-5は約30%です。-今のところ。 月曜日に更新されたGPT-5バージョンが提供されるかどうか見てみましょう。とにかく、このベンチマークがAIで飽和するまで6か月以上続くとは想像できません。https://t.co/ebVH7LWbZu
Rohan Paul: (翻訳) 私のニュースレターの今日の版がちょうど発行されました。 🔗 https://t.co/cFF6dKYvCR 購読を検討してください。無料です。毎日書いています。 🔬 AIベースの放射線学にとって悪いニュースです。医学における「医師レベル」のAIはまだ遠いです。 🏆 ガートナーの調査によると、ITアプリケーションリーダーのわずか15%しか https://t.co/MkeXVkMPfg