2026年04月24日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

DeepSeek-V4のオープンソース公開とGPT-5.5の詳細

DeepSeekの次期モデル「DeepSeek-V4」がオープンソースで公開されました。高性能かつ低コストで、すでに各所でサポートが始まっています。

また、OpenAI「GPT-5.5」のAPI価格判明や、xAIの新たな音声モデルなど、各社から注目のリリースが相次いでいます。

本日の主要な動向を順番に追っていきましょう。

目次

  1. DeepSeek-V4がオープンソースで公開【続報】
  2. GPT-5.5のAPI価格判明、MLE-BenchでSOTA【続報】
  3. CodexアプリにAuto-review機能追加【続報】
  4. xAIが音声モデルGrok Voice Think Fastを公開
  5. Cognition AIが評価額$25Bで資金調達を協議中
  6. Sakana AIがマルチエージェントシステムFuguを公開
  7. Claude Code品質低下のバグ修正【続報】
  8. Gemini Enterprise Agent Platform詳細判明【続報】
  9. Project Prometheusが$10Bの資金調達完了【続報】
  10. OpenAIチーフサイエンティストが今後の急速な進歩を示唆

DeepSeek-V4がオープンソースで公開【続報】

  • 以前から噂されていたDeepSeekの次期モデル「DeepSeek-V4」のプレビュー版がオープンソースでリリースされました。
  • 1.6TパラメータのProと284BパラメータのFlashの2種類が提供され、1Mトークンのコンテキストウィンドウをサポートしています。
  • GPT-5.4やOpus 4.6に匹敵する性能を持ちながら非常に低コストであり、vLLMやOllamaなどでも即日サポートされています。
Lisan al Gaib: (翻訳) 🚀 DeepSeek-V4 Previewが正式に公開され、オープンソース化されました!コスト効率の高い1Mコンテキスト長の時代へようこそ。 🔹 DeepSeek-V4-Pro: 合計1.6T / アクティブ49Bパラメータ。世界トップクラスのクローズドソースモデルに匹敵する性能。 🔹 DeepSeek-V4-Flash: 合計284B / アクティブ13Bパラメータ。

Chubby♨️: (翻訳) Deepseek v4はDeepSeek 3と比べて大きな飛躍であり、SWE verifiedでopus 4.6やGPT-5.4を上回り、Codeforcesで新記録を樹立しました。opus 4.7やGPT-5.5と比較テストし、実際の使用で期待通りか確認する必要がありますが、大きなリリースです!SOTAのオープンソースです。

ollama: (翻訳) 🐳Ollamaは、OllamaのクラウドでDeepSeek-V4-ProとFlashを利用できるように作業を進めています。

GPT-5.5のAPI価格判明、MLE-BenchでSOTA【続報】

  • OpenAIの「GPT-5.5」に関する続報です。
  • API価格が入力100万トークンあたり5ドル、出力30ドルに設定されたことが判明しました。
  • 100万トークンのコンテキストウィンドウを持ち、前モデルよりもトークン効率が良く実質的なコストは抑えられると評価されています。
  • MLE-BenchでSOTA(36%)を記録するなど、エージェント的なMLエンジニアリング作業で高い性能を示しています。
まつにぃ: API料金は ・入力トークン100万あたり5ドル ・出力トークン100万あたり30ドル ・コンテキストは100万トークン ただしトークン効率がよく、実際のアウトプットに至るまでのコストはGPT5.4よりも安い。 アウトカム主義のモデル。 そして普通に速い。

Kenn Ejima: GPT-5.xモデルの値上げがエグい GPT-5 nano — $0.05 GPT-5 mini — $0.25 GPT-5 — $1.25 GPT-5.2 — $1.75 GPT-5.4 — $2.50 GPT-5.5 — $5.00 5.5はとうとうOpus超えて世界一高価なモデルに モデル価格ってもはや石油みたいな時価だと考えたほうが良さそう 資源争奪戦争勃発🔥

Haider.: (翻訳) もう一つの重要なベンチマーク:gpt-5.5は、AIシステムが実際のMLエンジニアリング作業でどれだけ優れているかをテストするMLE-Benchで新たなSOTAを樹立しました。gpt-5.5: 36%、gpt-5.4: 23%。これは実際のML作業を測定し、自律的なMLを追跡するため、より意味のあるエージェントベンチマークの一つだと信じています。

CodexアプリにAuto-review機能追加【続報】

  • OpenAIのmacOS向け開発環境「Codex App」の続報です。
  • 新たに「Auto-review」機能が追加され、長時間のタスクや自動化において別のエージェントがリスクの高いステップをチェックするようになりました。
  • これにより、人間の承認を減らしつつ安全な実行が可能になります。
  • また、ブラウザ操作機能の拡張や音声入力のグローバル対応なども追加され、NVIDIAが全社的に導入したことも話題になっています。
OpenAI Developers: (翻訳) Auto-reviewは、Codexがより少ない承認でより長く、より安全に実行できるようにする新しいモードです。長時間のタスクや自動化中を含め、Codexがテストやビルドなどを進め続けるのを助ける一方で、別のエージェントが実行前にコンテキスト内でリスクの高いステップをチェックします。

TestingCatalog News 🗞: (翻訳) Codexは、拡張されたブラウザ使用機能、更新されたドキュメント生成、そして新しいauto-review機能を獲得しました。スーパーアプリですね👀

Romain Huet: (翻訳) @nvidiaがCodexに全力投球しているのを見るのは素晴らしいです!私たちはCodexとGPT-5.5を展開するためにいくつかの企業と深く関わり始めました。この規模でこれほど早く機能するのを見るのはエキサイティングです。Blackwellを稼働させましょう!

xAIが音声モデルGrok Voice Think Fastを公開

  • xAIが音声エージェント構築向けの新しいフラッグシップ音声モデル「Grok Voice Think Fast 1.0」をリリースしました。
  • 複雑なマルチステップのワークフローに対応し、ノイズやアクセント、割り込みなどの現実世界のノイズに強いのが特徴です。
  • xAI Consoleでテスト可能で、GitHubにはカスタマーサポート通話のサンプルアプリも公開されています。
TestingCatalog News 🗞: (翻訳) xAIは、音声エージェント構築向けの新しいフラッグシップ音声モデル「Grok Voice Think Fast 1.0」をリリースしました。このモデルはxAI Consoleでもテスト可能です。

Tech Dev Notes: (翻訳) xAIは、新しいVoice Agent API用のサンプルアプリをGitHubに作成しました。

Tech Dev Notes: (翻訳) xAIは、カスタマーサポート通話におけるGrok Voice Think Fast 1.0のワークフロー例を追加しました。

Cognition AIが評価額$25Bで資金調達を協議中

  • ソフトウェア開発におけるAI活用への需要が高まる中、Cognition AIが新たな資金調達ラウンドに向けて初期の協議を行っていると報じられました。
  • この資金調達が実現すれば、同社の評価額は250億ドル以上に倍増することになります。
  • AIソフトウェア開発エージェント市場の急成長を裏付ける動きとして注目されています。
Bloomberg: (翻訳) 関係者によると、Cognition AIは評価額を250億ドル以上に倍増させる新たな資金調達ラウンドに向けて初期の協議を行っており、ソフトウェア開発におけるAIの活用方法を理解している企業への需要の高まりを利用しています。

Sakana AIがマルチエージェントシステムFuguを公開

  • Sakana AIが新しい商用AI製品「Sakana Fugu」のベータ版を公開しました。
  • 複数のフロンティアモデルやOSSモデルを動的に調整し、タスクごとに最適なモデルに割り振るマルチエージェントオーケストレーションシステムです。
  • SWE-Pro、GPQA-D、ALE-BenchなどのベンチマークでSOTAを達成したと報告されています。
Kosuke Nakago: 世の中のFrontier model, OSS modelを使いこなして、タスクごとに最適なサブタスクに分解し、それぞれを得意なモデルに割り振り、SoTA性能を引き出す、、、そんな創業当初からかかげていたCollective Intelligenceを実現したFuguがBeta testで試せます!

Robert Lange: (翻訳) 新しいフロンティアLLMオーケストレーターモデル @SakanaAILabs。fuguモデルシリーズは、テスト時スケーリングの斬新なパラダイムを提供します。これらのモデルはLLMを呼び出し、どの個別のモデルが特定のタスクに適しているかだけでなく、クエリをどのようにオーケストレーションするかを推論するように訓練されています。

Claude Code品質低下のバグ修正【続報】

  • 過去1ヶ月間報告されていたClaude Codeの品質低下問題に関する続報です。
  • Anthropicが調査結果を公表し、デフォルトのThinking Effortの変更やキャッシュ最適化によるバグが原因であったと説明しました。
  • v2.1.116以降でこれらの問題が修正され、影響を受けたユーザーの利用制限もリセットされています。
Oikon: 最近のClaude Codeの品質低下について モデルが原因ではなくClaude CodeとAgent SDKハーネスに起因すると報告。以下の3つが品質低下の主な要因: ・Claude CodeのデフォルトThinking Effortの変更 (hight -> medium) ・過去の推論を削除するキャッシュ最適化 (全ターンでthinkingをクリアするバグ)

Oikon: Claude Code 2.1.119 (抜粋) - /config の設定(theme、editor mode、verbose など)が ~/.claude/settings.json に永続化され、project/local/policy のオーバーライド優先順位に参加するように - フッターの PR バッジを カスタムのコードレビュー URL に

Gemini Enterprise Agent Platform詳細判明【続報】

  • Google Cloud Nextで発表された「Gemini Enterprise Agent Platform」の続報です。
  • Agent RegistryやAgent Gatewayにより、複数エージェントの交通整理を行いマルチAIエージェント環境を実現します。
  • Agents CLIを用いて、バンドルされたスキルをコーディング環境に直接注入できる機能も公開されました。
Google Cloud Japan: Vertex AI の進化形、 Gemini Enterprise Agent Platform を発表 → Model Garden を通じて 200 以上の主要な AI モデルへアクセス可能。開発者からビジネス ユーザーまで、迅速に AI エージェントを大規模に構築し、デプロイできるよう支援します。 #GoogleCloudNext

Google Cloud Japan: Gemini Enterprise を拡張! 安全で協調的、自律的なエンジンへ進化 → 複雑な業務を自動化: 🟦特定のワークフローを Skills として定型化 🟦数時間から数日にわたって自律的に動作 🟦Inbox でエージェント管理 🟦Data Insights エージェントで統合分析 #GoogleCloudNext

Kimihiko Kitase ♨️ 北瀬 公彦: G-Gen の速報ブログなしには生きていけない (引用ツイート: Google Cloud Next、2日目のDeveloper Keynote(開発者向け基調講演)。新発表のAgent RegistryとAgent Gatewayを使い複数エージェントの交通整理することでGoogleが描くマルチAIエージェントの世界を実現する。自然言語での開発と運用でスケールもできる #GoogleCloudN...

Project Prometheusが$10Bの資金調達完了【続報】

  • Jeff Bezos氏らが率いるAIラボ「Project Prometheus」の資金調達に関する続報です。
  • 約100億ドルの資金調達ラウンドを完了し、同社の評価額は約380億ドルに達したと報じられました。
  • 巨額の資金を背景に、AI分野での新たな展開が予想されます。
Bloomberg: (翻訳) 関係者によると、Amazonの創業者Jeff Bezos氏とGoogleのベテランVik Bajaj氏が率いるAIラボ「Project Prometheus」が、同社を約380億ドルと評価する100億ドルの資金調達ラウンドを完了しました。

OpenAIチーフサイエンティストが今後の急速な進歩を示唆

  • OpenAIのチーフサイエンティストJakub Pachocki氏が、今後のAIモデルの進歩について言及しました。
  • 「短期的にはかなり大きな改善、中期的には極めて大きな改善が見込まれる」と発言しています。
  • また、「ここ数年は驚くほど遅かった」とも述べており、今後の急速な進歩を予告しています。
morgan —: (翻訳) OpenAIのチーフサイエンティスト、Jakub Pachocki氏「短期的にはかなり大きな改善、中期的には極めて大きな改善が見込まれます」「かなり急速な進歩が続くと予想しています...ここ数年は驚くほど遅かったと言えるでしょう」

Chubby♨️: (翻訳) より速いリリースがやってきます。隔月ではなく毎月のリリースが見られるかもしれません。OpenAIのチーフサイエンティスト:短期的には大きな改善、中期的には極めて大きな改善。私たちはまだ始まったばかりです。

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください