25 5月 2026

2026年05月25日朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

DeepMindによる数学的未解決問題の証明とAIコーディングを巡る議論

Google DeepMindがAIを用いてErdosの未解決問題を新たに9つ証明し、高度な数学的推論能力を示しました。

また、NVIDIAのCEOの発言を機に、AI生成コードをエンジニアが読むべきかという議論が白熱しています。

その他、Claude未公開モデルの誤表示や、OpenAI等のIPO競争も注目を集めています。

本日の主要なトピックを順番に掘り下げていきましょう。

Claude MythosがUIに誤表示され一時アクセス可能に【続報】
DeepMindがErdos未解決問題を新たに9つ証明【続報】
NVIDIA CEO発言でAIコーディング巡る議論白熱
Codexでスキルを自動生成するプロンプトが流行
ハーバード大がAIカリキュラムをYouTubeで無料公開
OpenAI等3社の同時期IPOで資金獲得競争へ【続報】
AIエージェント向け「SOUL.md」などプロンプト技術が話題
NVIDIAのJensen Huang CEOが台湾の夜市を訪問し話題に
DeepSeekのハードウェア制約を逆手にとる戦略が話題に
Kaggleの集まりでAIロボットによる即興漫才が披露される

Claude MythosがUIに誤表示され一時アクセス可能に【続報】

Anthropicの未公開モデル「Mythos」に関する続報です。
ClaudeのUI上に同モデルが誤って表示され、一時的にアクセス可能になる事態が発生しました。
すぐに容量オーバーとなりアクセスできなくなりましたが、Claude CodeやClaude Security向けにリリース準備が進められていることが確認されました。
先日、セーフガード開発後の一般公開方針が示されたばかりであり、正式リリースに向けた動きが加速しています。

Chubby♨️: (翻訳) Anthropicが誤ってMythosをUIに表示させ、すぐに容量オーバーになりました。

Kol Tregaskes: (翻訳) Claude Mythos Previewが一時的にClaude上に現れました。しかし、一般公開は期待しないでください。

Oikon: Claude Mythos 1 が Claude CodeとClaude Securityで一部見えるようになったり、Claude Opus 4.8が噂されていたり👀

DeepMindがErdos未解決問題を新たに9つ証明【続報】

Google DeepMindによるAIの数学的未解決問題への挑戦に関する続報です。
LLMとLeanエージェントを自律的に連携させる手法を用い、Erdosの未解決問題を新たに9つ証明したことが報告されました。
人間によるレビューの前に形式的な検証を行うループを構築しており、数学的推論能力の高さが示されています。
OpenAIの内部モデルも同様の成果を上げているとされ、フロンティアモデル間の数学的推論能力の競争が激化しています。

Chubby♨️: (翻訳) さらに9つのErdős問題が解決されました。しかし今回はGoogle DeepMindによるものです。

Haider.: (翻訳) 一方、OpenAIの内部モデルは長年のErdosの数学問題を解決しています。

Tibor Blaho: (翻訳) OpenAIは、内部の推論モデルがErdősの1946年の平面単位距離予想を自律的に反証したと発表しました。

NVIDIA CEO発言でAIコーディング巡る議論白熱

AIによるコード生成が普及する中、エンジニアがコードを読む必要性について議論が白熱しています。
「生成されたコードの責任を負うために読むべき」という意見と、「ソースコードはバイナリのように抽象度が上がったためAIに任せるべき」という意見が対立しています。
NVIDIAのJensen Huang CEOも「エンジニアがコーディングを全くしなくなることが最大の喜び」と発言しており、開発のパラダイムシフトが注目されています。

Kenn Ejima: AI任せでコードを書くことにいまだに抵抗するエンジニアはさすがに危機感がなさすぎて津波が来てるぞー！と皆で警告してるのに「大騒ぎして避難させて責任取れるのか」みたいに逆ギレされてつらいけど CodexやOpusと2-3ヶ月向き合ってなければ 1年前の感覚のままというのもわかるので

Lee Robinson: (翻訳) AIのおかげでコードについて考える時間を減らすべきだと信じているかもしれません。私は強く反対します！私たちは、大量のAI生成コードが負債となるのをリアルタイムで見ています。

Philipp Schmid: (翻訳) 私はAI以前よりも簡単に20倍以上コードを読み、見ています。楽しいです。そして学ぶのにこれほど良い時期はありませんでした。

Codexでスキルを自動生成するプロンプトが流行

Codexに過去のセッション履歴を分析させ、反復作業を「スキル」や「サブエージェント」として自動生成させるプロンプトが流行しています。
この自己改善プロンプトにより、日常的なワークフローの自動化がさらに容易になると評価されています。
OpenAIのGreg Brockman氏も言及しており、Codexの新たな活用法として広く拡散されています。

Vaibhav (VB) Srivastav: (翻訳) これをCodexにコピー＆ペーストしてください：「最近のCodexセッションに目を通し、繰り返されるワークフローや要求を特定してください。」

Vaibhav (VB) Srivastav: (翻訳) Codexにセッション、Memories、Chronicle全体を見てパターンを特定し、既存のものを再利用し、最小の有用なスキル、サブエージェント、または自動化のみを作成するように依頼します。

Greg Brockman: (翻訳) Codexのための自己改善プロンプト

ハーバード大がAIカリキュラムをYouTubeで無料公開

ハーバード大学がAIカリキュラム全体をYouTubeで無料公開し、大きな反響を呼んでいます。
高品質な学習リソースが無料で提供されており、AIエージェント構築などを学ぶ絶好の機会として拡散されています。

CyrilXBT: (翻訳) ハーバード大学がAIカリキュラム全体をYouTubeで無料公開しました。

CyrilXBT: (翻訳) Claudeのエンジニアが、Anthropicが実際にどのようにAIシステムをプロンプトし構築しているかについての33分間の無料マスタークラスを公開しました。

CyrilXBT: (翻訳) ゼロからAIエージェントを構築する方法を教えてくれる10の完全無料リソース。

OpenAI等3社の同時期IPOで資金獲得競争へ【続報】

OpenAI、Anthropic、SpaceXのIPO計画に関する続報です。
これら3社が同時期に上場する可能性が浮上しており、ウォール街の投資資金を巡る競争が激化すると予想されています。
いずれも評価額が1兆ドル規模に達すると見込まれており、どの企業が公開市場におけるAIのナラティブを定義するかが注目されています。

The Information: (翻訳) ウォール街が1兆ドル規模のテクノロジー企業の上場の波に備える中、OpenAIの加速するIPO計画は、AnthropicやSpaceXとの対決を引き起こす可能性があります。

The Information: (翻訳) SpaceX、OpenAI、Anthropicはすべて、各社の評価額が1兆ドル近く、あるいはそれ以上になる可能性のあるIPOに向けて競争しています。

AIエージェント向け「SOUL.md」などプロンプト技術が話題

AIエージェントのアイデンティティや振る舞いを定義する「SOUL.md」のベストプラクティスが共有され、注目を集めています。
また、CodexやClaude Codeの挙動を制御する「AGENTS.md」の設定方法なども活発に議論されています。
単なるデフォルトのAIではなく、特定の役割を持ったエージェントを効果的に構築するためのノウハウが蓄積されています。

Charly Wargnier: (翻訳) この人は文字通り、AIエージェントのための完璧なSOUL.mdファイルの解剖学を公開しました。

限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: CodexやClaude Code使っていますか？私はすっかりCodex派で、ChatGPTのウェブ版を開くよりもCodexを立ち上げる頻度のほうが多くなりました非エンジニアのためのCodexの挙動を決定するAGENTS.mdの設定を紹介しました

限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: CodexやClaude Codeでファイルが直接編集できるのに慣れてしまうとWeb版よりも圧倒的に使用頻度が増えますねこのNoteのセットはSkillが含まれるファイルをダウンロードすることですぐにCodexで論文執筆や科研費申請が始められます

NVIDIAのJensen Huang CEOが台湾の夜市を訪問し話題に

NVIDIAのJensen Huang CEOが台湾を訪問し、現地の夜市（饒河街観光夜市）に姿を現したことが話題になっています。
彼が海外を訪れる際に地元のフードマーケットに立ち寄ることは恒例となっており、多くの群衆に囲まれる様子がSNSで共有されています。
Computex前の関係者面会や社内ミーティングのための早期入りと見られています。

Evan: (翻訳) 人生における確実なこと。Jensen Huangが海外にいるときはいつでも…地元のフードマーケットにいる彼のビデオを見ることを期待してください。

Evan: (翻訳) 完全に当てにできることがあります。NvidiaのCEOであるJensen Huangが海外にいるときはいつでも…地元のフードマーケットにいる彼のビデオを見ることを期待してください。

パウロ: 今回は夫婦で夜市を楽しみましたね二人とも良い笑顔だ

DeepSeekのハードウェア制約を逆手にとる戦略が話題に

DeepSeekは単なる低価格チャットボットではなく、ハードウェアの制約を戦略に変えるアーキテクチャを採用しているという考察記事が話題になっています。
MoEなどの急進的なフレームワークを用いて、中国のメモリやアクセラレータをフロンティアAIに活用しようとする姿勢が高く評価されています。
短期的な利益よりも長期的な視点での開発を進めている点が注目されています。

Rohan Paul: (翻訳) DeepSeekに関する素晴らしい記事です。彼らの本当の物語は安価なチャットボットではなく、ハードウェアの不足を戦略に変えるアーキテクチャです。

Charly Wargnier: (翻訳) DeepSeekへの魅力的な深掘りにより、見事に型破りな戦略が明らかになりました。

Kaggleの集まりでAIロボットによる即興漫才が披露される

Kagglerの集まりにおいて、AIロボットの「スタックチャン」と「ReachyMini」を用いた即興のKaggle漫才が披露されました。
その場のノリでネタを構築し演じる様子が、新しいエンターテインメントの形として好評を博しています。
ネタが組み上がっていく過程まで見せられる点が、参加者にとって非常に良い体験だったと報告されています。

t.toda: Kagglerの集まりで #ｽﾀｯｸﾁｬﾝと #ReachyMini に即興のKaggle漫才を披露してもらったその場のノリでネタを組んで、そのまま演じてくれるのが思った以上に体験良かったモブプロではないが、ネタが組み上がっていく過程まで見せられるのが楽しい

yuki: 漫才の内容も普通に面白かった