2026年06月13日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Claude Fable 5の数学ベンチマーク首位獲得とDeepMindによるASI移行経路の研究
Claude Fable 5が数学ベンチマークでGPT-5.5を上回り、推論能力の高さを示しました。
また、Google DeepMindがAGIからASIへの移行経路に関する論文を発表し、今後の技術的発展の道筋を整理しています。
医療分野で汎用LLMが特化型AIを上回った研究結果も注目を集めています。
本日の主要な動向を順に確認してまいります。
目次
- SpaceXがIPO実施、時価総額2兆ドル突破【続報】
- Claude Fable 5がFrontierMath等でSOTA達成【続報】
- Moonshotがコーディング特化OSS「Kimi-K2.7-Code」公開
- Metaが従業員のAIトークン使用量を制限【続報】
- 医療分野の評価で汎用LLMが特化型AIを上回る結果に
- Google DeepMindがAGIからASIへの移行経路に関する論文を発表
- MiniMax M3がHF公開、NVIDIAが無料提供【続報】
SpaceXがIPO実施、時価総額2兆ドル突破【続報】
- SpaceXのIPOに関する続報です。
- NasdaqでIPOを実施し、時価総額が2兆ドルを突破しました。
- これにより、Elon Musk氏が世界初のTrillionaire(兆万長者)になったと報じられています。
- 予想される最大市場規模のほぼ全てをAIが占めるとされており、AIインフラやxAIへの資金供給の観点からAI業界でも注目を集めています。
Financial Times: (翻訳) SpaceXの株価が11%上昇したことで、イーロン・マスクは世界最大の企業2社を支配する世界初の兆万長者(トリリオネア)となりました。
Rohan Paul: (翻訳) SpaceXの公式SECファイリングによると、予想される28.5兆ドルの獲得可能な最大市場規模(TAM)のほぼすべてをAIが占めるとされています。
Andrej Karpathy: (翻訳) SpaceXとその過去、現在、未来のストーリーに畏敬の念を抱いています。10以上の異なる視点から考えることができ、何度も驚かされ続けます。チームの皆さん、本当におめでとうございます!🚀
Claude Fable 5がFrontierMath等でSOTA達成【続報】
- Claude Fable 5に関する続報です。
- FrontierMath Tier 4で88%を達成し、GPT-5.5を上回り首位を獲得しました。
- Anthropicのモデルが数学の分野でOpenAIを上回るのはこれが初めてだと指摘されています。
- InferenceBenchでもSOTAを達成するなど、推論能力の高さが改めて証明されています。
Lisan al Gaib: (翻訳) Fable 5 (low) がInferenceBenchで新たなSOTAを達成しました。拒絶問題は誇張されていたようです。
leo 🐾: (翻訳) 🚨 Claude Fable 5がFrontierMath Tier 4 v2で87.8%を記録し、(DeepMindを抑えて)1位を獲得しました。Opus 4.8から31.7パーセントポイントの飛躍です!Tier 1-3でも87%を記録し、GPT-5.5を破って1位となり、Opusから7パーセントポイント上昇しました。
Lisan al Gaib: (翻訳) Fable 5がFrontierMath Tier 4で88%を記録しました。これはECIスコア164を意味します。Anthropicのモデルが数学でOpenAIを上回ったのはこれが初めてです。
Moonshotがコーディング特化OSS「Kimi-K2.7-Code」公開
- Moonshotがコーディングに特化したオープンソースモデル「Kimi-K2.7-Code」をリリースしました。
- 前バージョンのK2.6からコーディングやエージェント性能が向上し、推論効率も改善されています。
- Opus 4.8やGPT-5.5に匹敵する性能を持ちながら、コストは大幅に抑えられていると評価されています。
🚨 AI News | TestingCatalog: (翻訳) KIMI AI🔥: 新しいオープンソースモデル「Kimi K2.7 Code」がAPIとHuggingfaceでリリースされました! > K2.6からコーディングとエージェント性能が向上 > 推論効率の改善 > 長期的なコーディングに対応 テストの時間です👀
Bindu Reddy: (翻訳) Kimi 2.7がリリースされ、オープンソースのリーダーボードでトップになるでしょう。 - Opus 4.8やGPT 5.5に匹敵! - 優れたモデルであるKimi 2.6からさらに一段階進化 - SOTAモデルより20倍安価 おそらく世界最高のオープンソースモデルです。すぐに検証します。
Lisan al Gaib: (翻訳) MoonshotがKimi-K2.7-Codeをリリースしました。パフォーマンスだけでなく、効率面でもかなりの向上が見られるようです。
Metaが従業員のAIトークン使用量を制限【続報】
- Metaの社内AI利用に関する続報です。
- 以前はトークン消費を促進していましたが、AIコスト高騰を抑えるため、従業員のトークン使用量に上限を設ける方針に転換しました。
- リアルタイムでAI使用量と支出を追跡する内部プラットフォームを構築しています。
- 従業員に対してAI主導のインパクトを証明するよう促す一方で、社内ツールへの誘導を進めています。
Evan: (翻訳) マーク・ザッカーバーグとMeta Platformsは、従業員のトークン使用量に制限を設けることで、社内で急騰するAIコストを抑える計画です。Metaは、従業員のAI使用量と支出をリアルタイムで追跡する内部プラットフォームを構築しています - The Information
The Information: (翻訳) スタッフに「AI主導のインパクト」を証明するよう奨励した後、Metaは現在、従業員のトークン使用量に上限を設け、社内ツールへと誘導する動きを見せています。
医療分野の評価で汎用LLMが特化型AIを上回る結果に
- Nature Medicineに掲載された研究で、汎用LLMが医療特化型AIを上回る成績を収めたことが話題となっています。
- GPT-5.2やGemini 3.1 Pro、Claude Opus 4.6などが、OpenEvidenceなどの特化型AIよりも医療ベンチマークや実臨床クエリ評価で高評価を得ました。
- 医療AIにおいては、必ずしも「医学特化」が優れているとは限らないことが示唆されています。
限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: 医療AIは「医学特化」なら優れているとは限らないみたいです Nature Medicineの比較では、OpenEvidenceやUpToDate Expert AIより、GPT-5.2、Gemini 3.1 Pro、Claude Opus 4.6などの汎用LLMの方が、医療ベンチマークと実臨床クエリ評価で高成績
限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: 個人的な印象としては論文の選択に関してはOpenEvidenceの方が良い事もあるので基本はGPT-5.5Thinkingで検索して結果に不満がある場合はOpenEvidenceを使ってました
Google DeepMindがAGIからASIへの移行経路に関する論文を発表
- Google DeepMindがAGIからASI(人工超知能)への移行に関する論文を発表しました。
- 計算量やモデルサイズ、データ、テスト時計算の継続的なスケーリングなど、4つの技術的経路について解説しています。
- AGIからASIへの飛躍がどのようなルートで起こり得るかを体系的に整理した重要な研究として評価されています。
Rohan Paul: (翻訳) Google DeepMindからの素晴らしい論文です。AGIからASIへの経路と、その飛躍が複数のルートを通じて起こり得る理由を説明しています。著者らは、AGIからASIへの移行を4つの技術的経路を中心に構成しています: - 計算量、モデルサイズ、データ、テスト時計算の継続的なスケーリング
MiniMax M3がHF公開、NVIDIAが無料提供【続報】
- 中国MiniMaxの最新モデル「M3」に関する続報です。
- 同モデルのオープンウェイト版がHugging Faceで公開されました。
- 約428Bのパラメータを持ち、テキスト、画像、動画の推論に対応するロングコンテキストのマルチモーダルモデルです。
- これに合わせてNVIDIAが同モデルの無料エンドポイントの提供を開始し、開発者が容易にテストできる環境が整いました。
Lisan al Gaib: (翻訳) 小さすぎます。ベンチマーク特化の匂いがします。
🚨 AI News | TestingCatalog: (翻訳) NVIDIA ❤️ MiniMax。MiniMax M3のウェイトがHugging Faceで利用可能になり、NVIDIAはテスト用に自社プラットフォームで無料エンドポイントの提供を開始しました。