2026年05月08日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

OpenAIの新たな音声モデル公開と各社のAI統合の進展

OpenAIから推論能力を備えた「GPT-Realtime-2」など3つの音声モデルが公開されました。

また、AppleのAIカメラ搭載AirPodsのテスト進行や、ClaudeのOffice連携拡大など、身近なツールへのAI統合が進んでいます。一方で、CloudflareはAIファースト移行に伴う大規模な人員削減を発表しました。

本日の主要な動向を詳しく掘り下げていきます。

目次

  1. OpenAIがGPT-Realtime-2など音声モデル3種公開【続報】
  2. Apple、AIカメラ搭載AirPodsテスト後期段階へ【続報】
  3. OpenAI CodexのChrome拡張機能リリース【続報】
  4. Google、Gemini 3.1 Flash Liteを一般公開【続報】
  5. OpenAIとBroadcomのAIチップ開発が資金難航【続報】
  6. CloudflareがAIファースト移行で1100人削減へ
  7. ClaudeのOffice連携がWordやOutlookにも拡大【続報】
  8. Cursorにエージェント生成機能/orchestrateが登場
  9. Anthropicがバグバウンティプログラムを一般公開
  10. チューリングが自動運転モデルの可視化手法を解説

OpenAIがGPT-Realtime-2など音声モデル3種公開【続報】

  • OpenAIのリアルタイム音声モデルに関する続報です。
  • 新たにGPT-5クラスの推論能力を持つ「GPT-Realtime-2」など、3つの音声モデルがAPIでリリースされました。
  • リアルタイム翻訳やストリーミング文字起こしモデルも含まれています。
  • 会話の途中で推論を行い、より複雑な問題解決が可能になると開発者から高く評価されています。
Vaibhav (VB) Srivastav: (翻訳) 音声エージェントが完全復活しました!!本日、APIで3つの新しいリアルタイム音声モデルをリリースします:🎙️ GPT-Realtime-2(ツールを使用し、中断から回復し、128Kコンテキストで長い会話ができる音声エージェント向けのGPT-5クラスの推論能力)、🌍 GPT-Realtime-Translate(ライブ翻訳)

Greg Brockman: (翻訳) APIのGPT-Realtime-2推論モデルを使って、素晴らしい音声エージェントを構築できるようになりました。

Justin Uberti: (翻訳) 大規模なRealtime APIのリリースです! - 推論機能を備えた初のリアルタイムモデル gpt-realtime-2 - 音声対音声翻訳の gpt-realtime-translate - ストリーミング文字起こしの gpt-realtime-whisper

Apple、AIカメラ搭載AirPodsテスト後期段階へ【続報】

  • AppleのAIウェアラブル戦略に関する続報です。
  • AIカメラを内蔵した新しいAirPodsのテストが後期段階で進められていると報じられました。
  • カメラはSiriに周囲の視覚情報を提供し、文脈に応じた応答を可能にするためのものです。
  • 同社初のAIウェアラブルデバイスとして、2026年のリリースに向けて注目を集めています。
Mark Gurman: (翻訳) カメラ付きAirPodsはAirPods Proに似ていますが、カメラセンサーを収めるためにステムが長くなっています。カメラは周囲の状況を見てSiriにデータを提供し、質問に答えるのを助けるためのものです。メディアのキャプチャはできません。

Evan: (翻訳) Appleはカメラを内蔵した新しいAirPodsの開発の後期段階に達しました。AppleはこのAirPodsがAI時代に向けて設計された初のウェアラブルデバイスになることを期待しています。

Chubby♨️: (翻訳) 2026年はApple AIの年になるでしょう:AIとカメラを搭載したAirPod 3が登場します。新しいAirPodsは両耳にカメラを搭載し、Siriの目として機能し、低解像度の視覚情報をキャプチャします(写真やビデオではありません)。

OpenAI CodexのChrome拡張機能リリース【続報】

  • OpenAI Codexに関する続報です。
  • 専用のChrome拡張機能がmacOSおよびWindows向けにリリースされました。
  • ブラウザを乗っ取らずにバックグラウンドで複数タブを並行操作でき、ウェブアプリのテストなどを効率化します。
  • 開発者のブラウザ作業を大幅に支援するツールとして歓迎されています。
OpenAI Developers: (翻訳) Codexがブラウザでの開発作業をさらに引き受けられるようになりました。Codexアプリの新しいChromeプラグインを使用すると、ブラウザを乗っ取ることなく、ウェブアプリのテスト、タブ間のコンテキスト収集、ウェブDevToolsの並行した効率的な使用、結果の整理が可能になります。

TestingCatalog News 🗞: (翻訳) OPENAI 🔥: Codexに専用のChrome拡張機能がまもなく登場します! > 新しいChrome拡張機能により、Codexはブラウザ内のアプリやウェブサイトでの作業がさらに得意になります。ブラウザを乗っ取ることなく、バックグラウンドでタブをまたいで並行して動作します...

Vaibhav (VB) Srivastav: (翻訳) CodexがMacOSとWindowsのChromeで直接動作するようになりました!Codexがブラウザを乗っ取ることなく、様々なタブで複数のタスクをこなすのは魔法のようです。Codexアプリを更新し、Chromeプラグイン経由でインストールしてください - 今日試してみてください!!

Google、Gemini 3.1 Flash Liteを一般公開【続報】

  • プレビュー版として提供されていた「Gemini 3.1 Flash Lite」が一般公開された続報です。
  • 超低遅延かつ高ボリュームなタスク向けに設計されており、コスト効率が非常に高いモデルです。
  • AI Studioでのテストが可能となっており、エージェンティックなタスクや翻訳、シンプルなデータ処理での大規模な活用が見込まれています。
TestingCatalog News 🗞: (翻訳) GOOGLE 🚨: Gemini 3.1 Flash Liteが一般公開されました!ユーザーはAI Studioでもこのモデルをテストできます。 > 超低遅延、高ボリュームのタスク、比類のないコスト効率のために設計されたFlash-Liteは、すでに大規模なアプリケーションの構築方法を変革しています。

Bindu Reddy: (翻訳) Gemini 3.1 Flash Lite PreviewがGemini 3.1 Flash Liteになりました.... 🤷 私たちが期待しているような世界を揺るがす新しいリリースではありません。それはまだ来週に来ると思います。

OpenAIとBroadcomのAIチップ開発が資金難航【続報】

  • 以前から報じられているOpenAIとBroadcomのカスタムAIチップ共同開発に関する続報です。
  • 180億ドル規模とされる同計画が、資金調達の壁に直面していると報じられました。
  • Broadcom側は資金調達の条件として、Microsoftが初期バッチの約40%を購入することを求めています。
  • しかしMicrosoftはまだ購入を確約しておらず、NVIDIAへの依存を減らす計画の行方が危ぶまれています。
The Information: (翻訳) 独占:OpenAIのBroadcomとの180億ドルのチップ計画が資金調達の壁に直面しました。Microsoftがチップを購入する意思があるかどうかが、この取引の運命を決める可能性があります。

パウロ: さすがにAI ASICをMicrosoftに買わせるのは無理がある

CloudflareがAIファースト移行で1100人削減へ

  • Cloudflareが、エージェンティックAIファーストの運用モデルへの移行を加速するため、グローバルで1,100人以上の従業員を削減する計画を発表しました。
  • これは同社の労働力の約20%に相当する大規模な人員削減となります。
  • AIの進歩を背景に、企業が組織構造を根本から見直す動きが広がっています。
Bloomberg: (翻訳) Cloudflareは、エージェンティックAIファーストの運用モデルへの移行を加速するため、グローバルで1,100人以上の雇用を削減する計画です。

Evan: (翻訳) Cloudflareは、従業員の約20%に相当する約1,100人をレイオフする計画を発表しました。

ClaudeのOffice連携がWordやOutlookにも拡大【続報】

  • AnthropicのClaudeのOffice連携に関する続報です。
  • ExcelやPowerPointに続き、Wordでの一般公開とOutlookでのパブリックベータ版の提供が開始されました。
  • アプリ間を移動しても会話のコンテキストを保持できるのが特徴で、非エンジニア層の業務効率化がさらに進むと期待されています。
Henry Shi: (翻訳) 私はExcelが苦手で、正しい使い方を学んだことがありません。でもClaudeのおかげで、もうその必要はありません :) 非エンジニアにもClaudeの力をもたらすために、素晴らしい製品スイートを立ち上げたVerticalsチームと一緒に仕事ができて誇りに思います!

Cursorにエージェント生成機能/orchestrateが登場

  • 人気のAIコードエディタ「Cursor」に、新たなスキル「/orchestrate」が追加されました。
  • プラグインを追加することで利用可能になり、エージェントを再帰的に生成して複雑なタスクを処理させることができます。
  • 内部テストではトークン使用量の削減やコールドスタート時間の短縮などの成果が報告されています。
Oikon: Cursor に /orchestrate が登場。プラグインを追加することで利用可能 /add-plugin orchestrate https://t.co/ZNUv98o2mV

Anthropicがバグバウンティプログラムを一般公開

  • AnthropicがHackerOne上でセキュリティバグバウンティプログラムを一般公開しました。
  • これまでセキュリティ研究者コミュニティ内で非公開で実施されていましたが、今後は誰でも脆弱性を報告し報酬を受け取ることが可能になります。
  • AIモデルやシステムの安全性向上に向けた取り組みの一環として評価されています。
Anthropic: (翻訳) 当社のセキュリティバグバウンティプログラムがHackerOneで公開されました。これまでセキュリティ研究者コミュニティ内で非公開でプログラムを運営してきましたが、彼らの発見により当社の製品は強化されました。今後は誰でも脆弱性を報告し、報酬を受け取ることができます。

チューリングが自動運転モデルの可視化手法を解説

  • 自動運転開発スタートアップのチューリングが、新しいテックブログを公開しました。
  • End-to-Endの自動運転モデルが運転判断時に画像のどこに注目しているかを可視化する「Integrated Gradients」という手法について解説しています。
  • 基礎から実装まで詳しく書かれており、機械学習エンジニアにとって有用な記事となっています。
Yu Yamaguchi | チューリング CTO: チューリング、新しいテックブログを公開しました。 自動運転モデルが何を「見て」運転判断しているかを可視化する「Integrated Gradients」を基礎から実装まで解説しています。 信号・白線・対向車など、モデルが実際に注目している領域をヒートマップで確認できます👇️ https://t.co/vzCWJqFz3B

Tanahashi: E2E自動運転のモデルがどこに注目して運転しているのか、Integrated Gradientsという手法を使って可視化してみたというチューリングのテックブログです! https://t.co/eU7nRzxORq

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください