2026年04月17日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

OpenAI Codexの反響とClaude Opus 4.7の評価

OpenAI Codexのデスクトップエージェント機能がユーザーから高く評価され、大きな反響を呼んでいます。

一方、リリースされたClaude Opus 4.7は開発者の間で評価が分かれています。

また、AIエージェント普及に伴うCPU不足の深刻化や、OpenAIとCerebrasの巨額契約など、ハードウェア関連の動きも活発です。

本日の主要なトピックを順番に掘り下げていきます。

目次

  1. 多くの開発者がOpenAI Codexのデスクトップ操作を絶賛【続報】
  2. Claude Opus 4.7の評価二分、性能低下の指摘も【続報】
  3. Kaggle新コンペOrbit Wars開催、RTSゲームAI開発
  4. 生物学シミュレーション環境LabWorld Factory発表
  5. OpenAIとCerebrasの契約は$20B規模か【続報】
  6. Agent AI普及によるCPU不足が深刻化【続報】
  7. Microsoft製品群でOpus 4.7が即日利用可能に【続報】
  8. Google Colabにカスタム指示と学習モードが追加
  9. NotebookLMでカスタムカバーアートが設定可能に
  10. 超高難易度コーディングベンチマークFrontierSWE登場

多くの開発者がOpenAI Codexのデスクトップ操作を絶賛【続報】

  • OpenAI Codexのデスクトップエージェント機能に関する続報です。
  • 実際のユーザーから驚きの声が上がっており、MacのGUI操作の速さや画像生成機能の強力さ、ブラウザ内蔵によるシームレスな体験が高く評価されています。
  • Sam Altman氏も言及するなど大きな反響を呼んでおり、AIエージェントの新たな基準となりそうです。
Sam Altman: (翻訳) 皆がCodexに乗り換えているのは嬉しいですが、Tibo、もし私にレート制限をかけたり、劣ったモデルを使わせたりし始めたら...

Kenn Ejima: きた! 非コーディングのオペレーション自動化はClaude Desktop一択だったところ、ついにCodexがMac操作でほぼ何でもできるように 気分で手抜きするClaudeよりきっちり仕事してくれるはず…! これだよ欲しかったのは

Kevin Weil 🇺🇸: (翻訳) 新しいCodexのコンピュータ操作機能は驚くほど素晴らしいです

Claude Opus 4.7の評価二分、性能低下の指摘も【続報】

  • 正式リリースされたClaude Opus 4.7に関する続報です。開発者の間で評価が分かれています。
  • 長文コンテキストの理解やClaude Codeでの動作を評価する声がある一方で、Adaptive thinkingの強制によるコスト増や、一部タスクでの性能低下を指摘する声も多く見られます。
  • 前モデルのOpus 4.6の安定性を惜しむユーザーも続出しており、今後のアップデートが注目されます。
Wolfram Ravenwolf: (翻訳) Hermes AgentのメインモデルをClaude Opus 4.7に切り替えましたが、すぐに4.6に戻しました。4.6はJSONの編集を一度も失敗しませんでした。一方、4.7はファイルを破損させ、自律エージェントの実行中にユーザー入力を求め、衝動的に行動して回避可能な問題を引き起こしました

K.Ishi@生成AIの産業応用: Claudeが幻滅期に突入している。 これ、今までClaude全盛期だったのは、実は単にOpusという大型モデルをコスト度外視で大盤振る舞いしていたから説。 今はユーザー獲得の目標を達成し、採算が合うように性能調整を始めた。 要は単なるマーケティングキャンペーンで、それが終わって幻滅という流れ。

Chubby♨️: (翻訳) Opus 4.7は約1.3倍のトークンを消費します。指示は非常に正確でなければなりません。多くの人が「急ぎすぎたリリース」だと不満を漏らしています。Bullshit BenchmarkではOpus 4.6よりも悪い結果を出しています。雰囲気は非常に複雑です。AnthropicはOpenAIに大きな恩恵を与えたかもしれません

Kaggle新コンペOrbit Wars開催、RTSゲームAI開発

  • Kaggleで新たなコンペティションOrbit Warsが開始されました。
  • 2Dの宇宙マップを舞台に、艦隊を派遣して惑星を占領し、500ターン後の艦船数を競うリアルタイム戦略(RTS)ゲームのAIボットを開発する内容です。
  • ゲーム系のコンペティションということで、多くのKagglerから注目を集めています。
Takami Sato: Kaggle新コンペ 2Dの宇宙マップで艦隊を派遣して惑星を占領し、500ターン後の艦船の総数を競うRTSゲームのAI作成コンペ。2人または4人のAIでプレイ

nadare: 今は本業が第一だけど、もう一度人生のどこかでhaliteコンペやコドゲのunleash the geekみたいな対戦型ゲームコンペに没頭したいなぁと思い続けてる

エチレン: Nemotron コンペが人力trace生成コンペになってしまった今、かなり Orbit Wars やりたくなっている

生物学シミュレーション環境LabWorld Factory発表

  • Stanford大学とPrinceton大学の研究チームが、AIエージェントの訓練やテストを目的とした生物学シミュレーション環境「LabWorld Factory」を発表しました。
  • 自然言語のプロンプトから実行可能なデジタルラボを生成し、10,000以上の生物医学スキルをシミュレートできます。
  • AIによる科学研究の自動化を加速させる重要な基盤として期待されています。
Rohan Paul: (翻訳) クローズドループのAI科学者時代の幕開けです。LabWorld Factoryは、平易な英語のプロンプトをAIエージェントの訓練とテストのためのシミュレートされた生物学ラボに変換するシステムです。Stanford-Princeton AI Coscientist Teamの支援を受けています。AIは科学のあらゆる層に入り込みつつあります

Alvaro Cintas: (翻訳) スタンフォード大学とプリンストン大学は、AIに独自の無限の実験室を与えました。LabWorldと呼ばれています。実際の生物医学プロトコルを完全に実行可能なデジタルシミュレーションの世界に変換します。→ 100のリアルなラボアセット → 1,000の正確なアトミックスキル → 10,000以上の実行可能な生物医学

OpenAIとCerebrasの契約は$20B規模か【続報】

  • 以前報じられたOpenAIとCerebrasの提携に関する続報です。
  • 今後3年間で200億ドル以上を支払う契約を結んだと新たに報じられています。
  • 契約には株式の取得権も含まれており、OpenAIがCerebrasの10%のワラントを取得する可能性があります。
  • NVIDIAへの依存を減らし、独自の計算資源を確保するための戦略的な動きと見られています。
morgan —: (翻訳) 注目のチップ (引用元: OpenAIは、株式の取得権と引き換えに、今後3年間でCerebrasのチップを使用するために200億ドル以上を支払うことに合意しました)

Agent AI普及によるCPU不足が深刻化【続報】

  • AIエージェントの普及に伴うCPU需要急増の続報です。
  • 世界的なCPU不足がさらに深刻化しており、プレミアム価格を支払ってもプロセッサが手に入らない状況が発生しています。
  • エージェント稼働におけるCPUの重要性が増しており、AIデータセンターでのx86アーキテクチャの再評価にも繋がっています。
Jukan: (翻訳) 「メモリとは異なり、CPUは現在プレミアムを支払っても入手不可能です」「したがって、CPUのさらなる価格上昇はおそらくないでしょう」私は少し違う見方をしています。

パウロ: 今年の1月にエージェントAIではCPUを使うのでCPUが足りなくなることをこのnoteで説明しています 今からでも間に合うので是非読んでみてください

Microsoft製品群でOpus 4.7が即日利用可能に【続報】

  • Anthropicの「Claude Opus 4.7」リリースに関する続報です。
  • Microsoft 365 CopilotやMicrosoft Foundryのモデルカタログで、同モデルが即日利用可能になりました。
  • 既存のSDKやツールチェーンをほぼそのまま利用でき、プラットフォーム側の迅速な対応が評価されています。
  • VS Codeから抜けずにAIエージェント開発を完結できる統合体験も提供されています。
まつにぃ: M365 CopilotにもCopilot CoworkにもOpus4.7来てて嬉しい。 即日出すこの速度感が大事ですよね。

daka | Microsoft | AI: Claude Opus 4.7 が Microsoft Foundry で本日から利用可能に Anthropicの最新・最上位モデルがFoundryのモデルカタログに登場。Opus 4.6からの直接アップグレードパスで、既存のSDK・ツールチェーンはほぼそのまま使えます。

Google Colabにカスタム指示と学習モードが追加

  • Google Colabに2つの新機能が追加されました。
  • ノートブックを共有する際にAIの挙動をカスタマイズできる「Custom Instructions」と、新しい内容を学ぶ際のパーソナルチューターとして機能する「Learn Mode」が利用可能になっています。
  • これにより、よりパーソナライズされた学習・開発体験が提供されます。
Colaboratory: (翻訳) Colabの2つの新機能をお試しください:💻 カスタム指示 - ノートブックと一緒に移動するため、共有した誰もがあなたが設計したカスタマイズされたAI体験を得られます。🧑‍🏫 学習モード - 新しい内容を学ぶためのパーソナルチューターとして機能します。詳細はこちら:

NotebookLMでカスタムカバーアートが設定可能に

  • GoogleのNotebookLMで、ノートブックにカスタムのカバーアートと説明文を追加できる機能が公式に発表されました。
  • これにより、ノートブックを共有する際によりパーソナライズされた魅力的な見栄えにすることが可能になります。
  • 16x9の画像をアップロードすることが推奨されています。
NotebookLM: (翻訳) すべてのノートブックにカスタムのカバーアートと説明を追加できるようになりました🥳 これは、美しいグリッドをキュレーションしたり、世界と共有する前にノートブックにパーソナライズされたタッチを加えたりするのに最適です。(特にヒーロー画像の16x9の画像をアップロードすることをお勧めします)

TestingCatalog News 🗞: (翻訳) GoogleはNotebookLMのノートブックカスタマイズ機能を公式に発表し、ユーザーがカスタムバナーとノートブックの説明を設定できるようにしました。

超高難易度コーディングベンチマークFrontierSWE登場

  • AIエージェントの長期的なコーディング能力をテストする新ベンチマーク「FrontierSWE」が公開されました。
  • ビデオレンダリングライブラリの最適化など非常に難易度の高いタスクが含まれています。
  • 20時間を与えられてもAIがほとんど成功しないレベルに設定されており、高度なコーディングエージェント開発の新たな指標となりそうです。
elvis: (翻訳) 長期的なコーディング能力をテストするためには、より挑戦的なベンチマークが必要です。FrontierSWEは、最高のコーディングエージェントやハーネスをテストするための素晴らしい新しいタスクセットのようです。

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください