2026年04月26日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

GPT-5.5のベンチマーク新記録とGemini次期モデルの動向

GPT-5.5がVoxelBenchで史上初の2000点超えを達成し、圧倒的な性能を見せています。一方でCopilotでの利用コストの高さも話題です。

また、Gemini次期モデルのリリースが間近に迫っているとの発言や、デジタル庁による行政向けAI基盤「源内」のOSS公開も注目を集めています。

本日の主要な動向を順番にご紹介いたします。

目次

  1. GPT-5.5がVoxelBenchで初の2000点超え【続報】
  2. GitHub CopilotのGPT-5.5消費枠7.5倍が話題に【続報】
  3. Samsungストライキ等でAI向けメモリ供給懸念が深刻化【続報】
  4. Geminiの次期モデルが間もなくリリースか
  5. デジタル庁がガバメントAI 源内をOSS公開
  6. MicrosoftのAI Agent開発環境がGA【続報】
  7. Cohereが独Aleph Alphaを買収し合併へ
  8. 長文編集評価ベンチマークDELEGATE-52発表
  9. ChatGPT Images 2.0のインフォグラフィック作成が話題【続報】
  10. DeepSeek-V4 APIが75%オフ、過剰適合の議論も【続報】

GPT-5.5がVoxelBenchで初の2000点超え【続報】

  • リリースされたGPT-5.5に関する続報です。
  • 新たにVoxelBenchにおいて史上初となる2000点超えを達成し、圧倒的な首位を獲得したことが話題となっています。
  • 開発者からは、前モデルから半減したトークン消費や、Cursor、Codexアプリなどでの優れたコーディング体験に引き続き絶賛の声が寄せられています。
Lisan al Gaib: (翻訳) GPT-5以降、OpenAIモデルの推論効率は継続的に向上しています!より少ないトークンでより高いスコアを達成しています。

Ryo Lu: (翻訳) GPT-5.5 + Composer 2に完全に移行しました。知能、速度、コストの完璧な組み合わせで、Cursorでのみ利用可能です。

Lisan al Gaib: (翻訳) レーティング2101対2位の1722。GPT-5.5は本物かもしれない。ただし、これらの超視覚的なタスクについては、ある程度のベンチマーク最適化を疑っていますが。

GitHub CopilotのGPT-5.5消費枠7.5倍が話題に【続報】

  • GitHub Copilotに統合されたGPT-5.5に関する続報です。
  • 複雑なエージェント的コーディングタスクで強力なパフォーマンスを発揮するとされています。
  • 一方で、1回のリクエストにつき通常の7.5倍の利用枠を消費する仕様となっており、コストの高さに驚く声が上がっています。
まつにぃ: GitHub CopilotにGPT-5.5来ましたが、7.5× premium requestかぁ。 これはちょっと高いですね。 200回しかリクエスト打てないので、GPTのProとかそっちのプランとは雲泥の差な気がしています。

Lisan al Gaib: (翻訳) おいおい、かわいそうなGitHubのプロダクトマネージャーたちも2隻目のヨットを買えるようにしてあげなきゃ。

Samsungストライキ等でAI向けメモリ供給懸念が深刻化【続報】

  • AI向け半導体メモリの供給不足に関する続報です。
  • NVIDIAの次世代AI半導体によるLPDDR5Xメモリの需要が急増し、来年の供給の72%を占めるとの予測が出ました。
  • さらに、Samsung電子の労働組合によるストライキが重なり、生産への影響が危惧されています。
  • これによりDRAM価格のさらなる高騰と供給不足が深刻化し、市場への影響が懸念されています。
Jukan: (翻訳) ハナ証券の強気シナリオでは、来年NVIDIA単独でLPDDRの総供給量の72%を占めると予測しています。聞いてますか?

パウロ: あーあ、DRAM市場が破壊される 現在の価格からさらに2~3倍になっても顧客に転嫁したり、自分のところで呑み込める企業が生き残る

パウロ: この状況で1か月間DRAM、NANDとファウンダリの生産を止めるのとか本当にすごいよなぁ ただ、それぐらいストライキは強烈ですよね まさに経営者と労働者の闘争

Geminiの次期モデルが間もなくリリースか

  • Google CloudのCEOが、Geminiの新しいバージョンが「非常に間もなく」登場すると発言したことが話題になっています。
  • ベンチマーク結果にも強い自信を見せており、開発者の間ではGemini 3.5または4.0のリリースが期待されています。
  • Google I/Oなどの大型イベントに合わせて発表されるのではないかという推測も飛び交っています。
Chubby♨️: (翻訳) 「間もなく」というのは5月18日頃を意味しているのだと思います。Google I/Oではおそらく素晴らしいサプライズがあるでしょう。

Haider.: (翻訳) 新しいGeminiモデルが間もなく登場します。Gemma 4がすでにリリースされており、3.1が3.0の直後に登場したため、Googleのリリースパターンが崩れたように見えます。そのため、Gemini 3.5をスキップして直接Gemini 4に進む可能性があります。3.5ではなく4.0になることを本当に願っています。

デジタル庁がガバメントAI 源内をOSS公開

  • デジタル庁が開発・運用する行政機関向けの生成AI利活用基盤である源内がオープンソースとして公開されました。
  • 行政職員が業務特化の生成AIアプリを迅速かつ安全に利用できる環境を提供するシステムです。
  • 政府機関が自ら開発したAI基盤をOSS化するという取り組みに対し、好意的な反応が寄せられています。
Itomaru 📿: ✔︎ 源内(GenAI) : デジタル庁が開発・運用する生成AI利活用基盤。行政職員が業務特化の生成 AI アプリを迅速かつ安全かつ簡単に利用できる環境を提供。

龍一郎 (f.k.a Asei Sugiyama): 確かにそうするのが筋が良いけど本当にやるのね ガバメントAI「源内」をオープンソースとして公開します|デジタル庁 @digital_jpn

MicrosoftのAI Agent開発環境がGA【続報】

  • Microsoftのエンタープライズ向けAIエージェント開発環境に関する続報です。
  • 以前プレビュー公開されていた「Foundry Toolkit for VS Code」や「Agent Framework v1.0」が一般提供(GA)されました。
  • 新たに「Hosted Agents」のプレビューも開始されています。
  • ローカルでの開発から本番環境へのデプロイまで、開発者の完全な道のりをサポートする強力なツール群となっています。
daka | Microsoft | AI: Foundry Agent Service の新しい Hosted Agents のご紹介 世界中から受けたフィードバックをもとに強化された一押し機能になってます! 何がアップデートされたかを知りたい方👇 - Hosted agent コア機能 ・セッションごとの VM 分離サンドボックス ──

daka | Microsoft | AI: ローカルから本番へ: AI エージェントの構築・組み合わせ・デプロイを実現する開発者の完全な道のり Microsoft、エンプラAIエージェント開発のフルスタックを発表 - Agent Framework v1.0 GA (SK + AutoGen 統合) - Foundry Toolkit for VS Code GA - Hosted Agents (Preview) -

Cohereが独Aleph Alphaを買収し合併へ

  • カナダのAI企業Cohereが、ドイツのAIスタートアップAleph Alphaを買収し合併することが報じられました。
  • この合併により「大西洋横断のAIパワーハウス」を創設し、欧州市場での競争力を強化する狙いがあると見られています。
  • エンタープライズ向けAI市場における合従連衡の動きとして注目を集めています。
TechCrunch: (翻訳) Cohereがドイツのスタートアップを買収・合併し、「大西洋横断のAIパワーハウス」を創設

TechCrunch: (翻訳) CohereがAleph Alphaと合併する理由

長文編集評価ベンチマークDELEGATE-52発表

  • Microsoftの研究チームが、コーディングや音楽記譜など52の専門領域における長文編集ワークフローをシミュレートするベンチマーク「DELEGATE-52」を発表しました。
  • プロアクティブなAIエージェントが、ユーザーの明示的な指示なしにニーズを予測して行動する能力を評価するためのフレームワークです。
  • エージェントの自律的なタスク遂行能力を測る上で重要な指標になると注目を集めています。
elvis: (翻訳) Microsoftからの新しい論文。これは重要な読み物です。(ブックマーク推奨)この研究では、コーディング、結晶学、音楽記譜など52の専門分野にわたる長文編集ワークフローをシミュレートするベンチマーク「DELEGATE-52」を紹介しています。テストされた19のモデルの中で、最先端のモデルでさえも

ChatGPT Images 2.0のインフォグラフィック作成が話題【続報】

  • OpenAIの画像生成モデル「ChatGPT Images 2.0」に関する続報です。
  • 同モデルを用いて、書籍の要約や絶滅危惧種の解説などを視覚的なインフォグラフィックとして生成する活用法が共有されています。
  • 単なる画像生成にとどまらず、複雑な情報を整理して視覚的に伝える学習ツールとして高く評価されています。
  • ユーザーからは、教育やプレゼンテーション資料の作成において非常に強力な機能であるとの声が上がっています。
Greg Brockman: (翻訳) GPT Image 2は学習に最適です

Greg Brockman: (翻訳) 絶滅危惧種について学ぶためのGPT Image 2

DeepSeek-V4 APIが75%オフ、過剰適合の議論も【続報】

  • DeepSeek-V4に関する続報です。
  • 5月5日までAPI利用料が75%オフになるキャンペーンが開始されました。
  • 一方で、SimpleQAなどの一部ベンチマークでスコアが低い理由について、モデルがメトリクスに過剰適合しているのではないかという議論が起きています。
  • 高いスコアと実際の知能の間にミスマッチがある可能性が指摘されています。
webbigdata: Deepseek V4の想像をはるかに越える解決策 予想外の回答にかなり笑ってしまいましたが、すいません、Deepseekは本当に凄いと思っています。 どうも「ナイフ1本だけで」という条件を、必要不可欠な条件、義務として解釈してしまうケースがあるのではないかと言う説

Lisan al Gaib: (翻訳) DeepSeekは5月5日まで75%の割引を提供しています

Itomaru 📿: (翻訳) deepseek-v4-proモデルは現在、2026年5月5日15:59 UTCまで期間限定の75%割引で提供されています。

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください