2026年06月01日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

GPT-5.5のベンチマーク首位獲得とOpenAIのロボティクス分野への本格参入

GPT-5.5がDeepSWEベンチマークでOpus 4.8を上回り、首位を獲得しました。コストや効率面でも高い評価を得ています。

また、OpenAIはロボティクス分野のエンジニア採用を強化し、AIの物理世界への拡張に本腰を入れています。次世代GPU「Vera Rubin」搭載ラックの納入開始も注目の動きです。

それでは、本日の主要な動向を順番に掘り下げていきましょう。

目次

  1. GPT-5.5がDeepSWEでOpus 4.8超え【続報】
  2. CoreWeaveとDellがVera Rubinラック納入【続報】
  3. xAI、Grok Imagine Video 1.5 Preview公開【続報】
  4. OpenAI Roboticsがエンジニア採用を強化
  5. SamsungとSK Hynixの利益予測が大幅上方修正【続報】
  6. GPT-Realtime-2の音声PC操作デモが話題【続報】

GPT-5.5がDeepSWEでOpus 4.8超え【続報】

  • GPT-5.5のDeepSWEベンチマークに関する続報です。
  • Opus 4.8の58%を上回る70%のスコアを記録し、首位を獲得したことが示されました。
  • コストやトークン効率の面でも優位性が確認されており、開発者コミュニティから改めて驚きの声が上がっています。
Vaibhav (VB) Srivastav: (翻訳) GPT-5.5が、難易度の高い長期コーディングベンチマークであるDeepSWEで1位を獲得しました🔥 Claude Opus 4.8の58%に対し、70%のpass@1を記録。さらにGPT-5.5は、約2倍の実行速度、約半分のコスト、約3分の1の出力トークンでこれを達成しています。文字通り、1ドルあたり、1分あたり、1タスクあたりの知能が向上しています。

Haider.: (翻訳) GPT-5.5は依然としてDeepSWEでOpus 4.8を圧倒しています。GPT-5.5: 70% pass@1、平均コスト$6.61、出力トークン47k。Opus 4.8: 58% pass@1、平均コスト$12.58、出力トークン136k。AIコミュニティが興奮せず、GPT-5.5に固執した理由がわかります。

Chubby♨️: (翻訳) Opus 4.8はDeepSWEにおいてOpus 4.7から確かな飛躍を遂げ、タスクあたりの平均コストも削減しました。しかし、GPT-5.5 xhighは依然として明確な差でそれを上回り、しかも安価です。OpenAIは最近、モデルの改良に猛烈に取り組んでいます。GPT-5.6がどうなるか本当に楽しみです。

CoreWeaveとDellがVera Rubinラック納入【続報】

  • 以前お伝えしたNVIDIAの次世代プラットフォーム「Vera Rubin」に関する続報です。
  • CoreWeaveとDellが、世界初となるVera Rubin NVL72ラックのL11テストを通過し、納入したことが報じられました。
  • 72基のRubin GPUと36基のVera CPUを搭載し、3.6 exaFLOPSの推論性能を誇ります。
  • 今後はソフトウェアレベルの立ち上げや複数ラックでのテストが進められる予定です。
SemiAnalysis: (翻訳) ニュース速報: COREWEAVEとDELLは、L11診断を完全にパスしたRUBIN VR200 NVL72を保有していると発表した最初のクラウドです。次のステップは、数台のラックをバーンインさせ、sglang、vllm、dynamoなどのソフトウェアレベルの立ち上げを行うことです。

パウロ: まじかっ CoreweaveとDellがVR200 NVL72ラックのL11テスト通過っ 思ってたより早い

Rohan Paul: (翻訳) クールなビジュアル。Dellが世界初のNvidia Vera Rubin NVL72ラックをCoreWeaveに納入しました。72基のRubin GPU、36基のVera CPU、3.6 exaFLOPSのFP4推論、75 TBの高速メモリ、260 TB/sのNVLink帯域幅を搭載しています。

xAI、Grok Imagine Video 1.5 Preview公開【続報】

  • xAIの動画生成モデル「Grok Imagine」に関する続報です。
  • 新バージョン「Grok Imagine Video 1.5 Preview」がAPIでリリースされました。
  • 前バージョンから大幅な性能向上を果たし、Image-to-Video Arenaで即座に1位を獲得しています。
  • 高品質な動画生成能力に多くのユーザーから注目が集まっています。
Tech Dev Notes: (翻訳) xAIがGrok Imagine Video 1.5 PreviewモデルをAPIでリリースしました。

Tech Dev Notes: (翻訳) Grok Imagine Video 1.5 PreviewモデルがImage-to-Video Arenaで1位にランクインしました。

🚨 AI News | TestingCatalog: (翻訳) Grok Imagine Video 1.5 PreviewがGrok APIで利用可能になり、Video Arenaでも1位を獲得しました。もう試しましたか?👀

OpenAI Roboticsがエンジニア採用を強化

  • Sam AltmanやGreg Brockmanが、OpenAI Roboticsでのエンジニア採用を大々的に呼びかけています。
  • 物理世界で人々の役に立つロボットをプログラムし、製造するためのフルスタックエンジニアやMLエンジニアを募集しています。
  • AIの能力をソフトウェアから物理世界へと拡張するOpenAIの強い意志が示されています。
Sam Altman: (翻訳) OpenAI Roboticsは採用を行っており、社会に役立つロボットをプログラムし製造するのを手伝ってくれる、優秀なフルスタックハードウェア、運用、システム、MLエンジニアを探しています。AIは物理世界で人々を助けることができるはずです。短期的には、私たちはロボットに焦点を当てています。

Greg Brockman: (翻訳) OpenAI Roboticsは、物理世界で人々を助けることができるAIの構築に向けて急速な進歩を遂げています。チームに参加するには今すぐ応募してください。

SamsungとSK Hynixの利益予測が大幅上方修正【続報】

  • 韓国半導体メーカーの利益予測に関する続報です。
  • Goldman Sachsが、AI需要の拡大を背景にSamsungとSK Hynixの2026年以降の営業利益予測を大幅に上方修正しました。
  • 2028年には両社の営業利益がそれぞれ約40兆円、約30兆円規模に達すると予測されています。
  • HBMなどのメモリ需要が引き続きAIインフラ市場を牽引していることが浮き彫りになりました。
Jukan @COMPUTEX: (翻訳) Goldman SachsがSamsungの営業利益予測を上方修正しました: 2026年: 355兆ウォン ($235.5bn) → 374兆ウォン ($248.1bn)、2027年: 438兆ウォン ($290.6bn) → 530兆ウォン ($351.6bn)、2028年: 495兆ウォン ($328.4bn) → 610兆ウォン ($404.7bn)

Jukan @COMPUTEX: (翻訳) Goldman SachsがSK Hynixの営業利益予測を上方修正しました: 2026年: 261兆ウォン ($173.1bn) → 271兆ウォン ($179.8bn)、2027年: 330兆ウォン ($218.9bn) → 401兆ウォン ($266.0bn)、2028年: 366兆ウォン ($242.8bn) → 454兆ウォン ($301.2bn)

パウロ: 2028年にSamsung電子とSK Hynixの営業利益が100兆円になるんか😂

GPT-Realtime-2の音声PC操作デモが話題【続報】

  • OpenAIの音声モデル「GPT-Realtime-2」に関する続報です。
  • 同モデルを用いて、音声だけでコンピュータを操作するデモが公開され話題を呼んでいます。
  • 手を使わずにブラウザやアプリケーションを操作する様子が「未来のOS」として絶賛されています。
  • リアルタイム音声モデルのポテンシャルの高さと、UIのパラダイムシフトを感じさせる内容となっています。
Greg Brockman: (翻訳) GPT Realtime 2は本物の魔法を解き放ちます:

Chubby♨️: (翻訳) 絶対に素晴らしい。これが私の想像するコンピュータ利用の未来です。大好きです。

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください