2025年06月04日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

OpenAIのo3-Pro提供拡大と新音声モデル、AI企業間の競争激化

OpenAIの動きが目立った一週間となりました。ChatGPT Plusユーザーへのo3-Proモデル提供開始の兆しが見え、新たな音声モデルとTypeScript版Agents SDKも発表されました。

一方、AI企業間の競争も激化しています。AnthropicがWindsurfへのClaudeアクセスを制限し、OpenAIとの買収報道との関連が取り沙汰されています。AppleのWWDC 2025でのAI大型発表も期待が高まっています。

NVIDIAは文書処理AIで新たな成果を上げ、中国市場向けの戦略も進化させています。AIによる業務自動化予測も注目を集めています。

それでは各トピックの詳細に進みましょう。

目次

  1. OpenAI、o3-ProをPlusユーザーへ提供開始か【続報】
  2. OpenAI、新型音声モデルやTypeScript版Agents SDK等を発表
  3. Anthropic、WindsurfへのClaudeモデルアクセス制限 背景にOpenAI買収報道
  4. Codex: ネット接続の安全性とプライベートリポジトリ巡る議論
  5. Google NotebookLM、ノートブックの一般公開機能を追加
  6. 【続報】Apple WWDC、AI大型発表への期待高まる 新情報続々
  7. NVIDIA、OCR首位の新モデルと中国向けB30チップ【続報】
  8. Google、Gemini基盤Deep ResearchエージェントOSS公開【続報】
  9. 元OpenAI幹部も予測 2027年末迄にAIが多くのPC業務代替【続報】
  10. Kaggle IMC 2025終了、振り返り期待と技術情報共有活発化

OpenAI、o3-ProをPlusユーザーへ提供開始か【続報】

  • OpenAIの高性能モデル「o3-Pro」について、ChatGPT Plusユーザー向けに提供が開始される可能性が濃厚です。【続報】
  • 一部のPlusユーザーのアカウントでは既にo3-Proが利用可能になったとの報告が複数確認されています。
  • OpenAI関係者によると、日本時間6月5日または6日未明に正式発表がある可能性が示唆されています。
  • これは、OpenAIによるモデルラインナップ強化と高度なAI機能の広範な展開戦略の一環と見られます。
TestingCatalog News 🗞: (翻訳) 速報🚨: OpenAIは本日、Proユーザー向けにo3-Proを、またTeamおよびEnterpriseアカウント向けにいくつかの他の機能(コネクタ?)をリリースする可能性があります。情報提供:@legit_api https://t.co/z4y2PzNH0A

Chubby♨️: (翻訳) どうやら今日がその日のようです:o3-pro! - すでに一部のユーザーには表示されています - OpenAIから太平洋時間午前10時に発表があります。

まつにぃ: OpenAIのDaniel McAuley氏が「明日10時(日本時間6/5 or 6/6 2:00)にライブします」と告知。 今の流れで言うと ・o3 Pro ・MCP コネクター 当たりが来そうで、 Linkdinでは ・Enterprise/Team版強化 が告知されています。 なんにせよ楽しみですね! https://t.co/l8tV1Bf8DO

OpenAI、新型音声モデルやTypeScript版Agents SDK等を発表

  • OpenAIは、新たな音声モデル「gpt-4o-audio-preview-2025-06-03」および「gpt-4o-realtime-preview-2025-06-03」をリリースしました。これらは指示追従性やツール呼び出し精度、割り込み耐性が向上し、話速調整も可能になったと報告されています。
  • また、エージェント開発を支援するAgents SDKのTypeScript版が公開され、Node.js以外の環境にも対応し、音声エージェント機能やRealtime APIのトレーシング機能も追加されました。
  • これらのアップデートにより、開発者はより高度でインタラクティブなAIアプリケーションを構築できるようになります。
Chubby♨️: (翻訳) OpenAIの新しい音声モデルが2つ登場予定です。 - オーディオプレビュー - リアルタイムプレビュー。リアルタイム版には本当に興奮しています! https://t.co/nhUBnqdmNs

Kazuhiro Sera (瀬良): 📣 OpenAI エージェント開発の大幅アップデート: 1. Agents SDK for TypeScript (Node 以外も対応!) 2. 同 SDK で音声エージェント機能に対応 3. Realtime API のトレーシング機能を追加 4. speech-to-speech モデルを改善 この SDK は私も開発に深く関わりました。ぜひ試してみてください!

まつにぃ: GPT-4oのnaitive音声モデルが6/3版にアップデートされました。 指示への追従能力とツール呼び出し精度向上、音声への割込時の耐性能力強化、話速調整も追加されました。 Realtime APIも同verに統一され、さらに対話精度が向上しています。

Anthropic、WindsurfへのClaudeモデルアクセス制限 背景にOpenAI買収報道

  • AIスタートアップWindsurfが、AnthropicからClaude 3.xモデルへのダイレクトアクセスを大幅に制限されたと報告しました。通知から実施まで5日以内という短期間だったとのことです。
  • この動きの背景には、先日報じられたOpenAIによるWindsurfの買収(未完了)が影響している可能性が指摘されています。
  • Anthropicが、自社モデルのデータがOpenAIによるモデル学習に利用されることを懸念した措置ではないかとの見方があります。
  • 本件に関してAnthropicからの公式な声明はまだ発表されていません。AI業界における企業間競争の激化と、それがエコシステムに与える影響について議論を呼んでいます。
TechCrunch: (翻訳) Windsurf社、Anthropic社がClaude AIモデルへの直接アクセスを制限していると発表 | TechCrunch https://t.co/REEZ29eyf8

Kenn Ejima: WindsurfでClaude 4が使えないの、Anthropicが5日前という超短期で主契約を解除する一方的な通告をしてきたらしい。OpenAIの買収(まだ完了してない)に対する報復的な措置なんだろうけど、こういう戦い方はフェアじゃないなぁ。ちょっと見損なったよ。

Ian Nuttall: (翻訳) これはOpenAIがWindsurfを買収したからに違いないですよね?Anthropicは自社モデルのデータでOAIが新しいモデルを訓練するのを望んでいないのでしょう。Windsurfユーザーにとっては最悪ですが。

Codex: ネット接続の安全性とプライベートリポジトリ巡る議論

  • OpenAIのコーディング支援AI「Codex」のインターネット接続機能に関する続報です。
  • プライベートリポジトリの内容が他のユーザーに表示される懸念に対し、GitHub APIのACL実装に依存しており問題ないとの情報があります。
  • インターネットアクセス機能による利便性向上の一方、セキュリティリスクも指摘され、開発現場での活用と安全性のバランスが議論されています。
Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭: (翻訳) codexが他の人に私のプライベートリポジトリを見せています。今すぐgithubからアンインストールすべきです。 https://t.co/56DKypZrWf

TestingCatalog News 🗞: (翻訳) いいえ、確認したところ、ChatGPTに接続してもあなたのプライベートリポジトリがランダムな人に見られることはありません。CodexはおそらくここでGitHub APIのACL実装に依存しています。 https://t.co/QCSPCXB9MY

Kenn Ejima: OpenAI Codexがやっとネットにつながるようになったけど、めっちゃ危ないから気をつけろよと。 とはいえ、なくてはならないものなので、事故るリスクを避けるか生産性をとるか。やばいのを踏んでしまうかどうかは運次第と割り切るしかないのか?

Google NotebookLM、ノートブックの一般公開機能を追加

  • GoogleのAI搭載ノートアプリ「NotebookLM」に、作成したノートブックを一般公開できる共有機能が追加されました。
  • これにより、ユーザーは自身の調査結果やまとめた情報をリンク一つで他者と簡単に共有できるようになります。
  • 記事を元にしたAIポッドキャストの共有や、勉強会の資料をインプットしたQ&Aボットの配布など、活用の幅が広がることが期待されています。
Shohei Okada: NotebookLM (個人向け)で作ったノートブックを、リンクを使って誰にでもシェアできるようになった。試しに AI Applications のリリースノートで作った Notebook のシェアは以下の感じ。 もう決算資料とか全部 PDF と合わせて Notebook もシェアするようにしてほしいw https://t.co/D8obDForRb

ChatGPT研究所: 【朗報】NotebookLMに待望の「一般公開機能」が追加 ・記事をもとにしたポッドキャスト ・勉強会資料をインプットしたQAボット など今まで他の人にも共有したかったノートブックを共有できるように。 その他、NotebookLMの最近のアプデ内容はこちらの記事でまとめました👇 https://t.co/DSNGKpiVnF

Kimihiko Kitase ♨️ 北瀬 公彦: NotebookLM でまとめたノートを公開できるようになりました✨✨ イベント前後に、関連ドキュメントや、YouTube、音声概要、クイズなどを用意して配布できるってことね。 素晴らしい🤩 https://t.co/4vDRD88Tvm

【続報】Apple WWDC、AI大型発表への期待高まる 新情報続々

  • Appleの来週のWWDC 2025に向け、当初懸念されていたAI関連発表が実現する可能性が高まっています。
  • 新たな報道によると、Appleは複数のパラメータサイズ(30億~1500億)のAIモデルや、「Knowledge」チャットボット、そして大幅に再設計されたSiriを準備しているとのことです。
  • また、AppleのサービスチームがPerplexityとの提携を検討している情報や、AnthropicのClaude SonnetをXcodeのAIコードエージェントとして採用する計画も明らかになり、AppleのAI戦略の全体像が徐々に見えてきました。
TestingCatalog News 🗞: (翻訳) ご参考:Appleは来週のWWDC 2025でAI関連の発表を行う可能性があります。複数のニュースソースによると、Appleは以下のものを保有しています: - 30億、70億、330億、1500億パラメータの4つのAIモデル - 新しい「Knowledge」チャットボット - 再設計されたSiri 👀 https://t.co/uqn34yY3wH

Tetsuro Miyatake: AppleがPerplexityと提携を検討していることをAppleのサービス担当者のEddy Cueが発言した。 今のAIモデル業界ではどのようにディストリビューションを獲得するのかの戦いになっている。 https://t.co/S1qgoN9vSS

Yuta Kashino: Apple, Anthropic Team Up to Build AI-Powered ‘Vibe-Coding’ Platform https://t.co/B95XNQeJlW これ,一部で大騒ぎしている人がいるけど,要するにXCodeにAIコードエージェントとして,内製のSwift Assistを捨てて,Claude Sonnetを採用するというだけですね…

NVIDIA、OCR首位の新モデルと中国向けB30チップ【続報】

  • NVIDIAが文書処理・理解のためのAIモデル「Llama Nemotron Nano VL」を発表しました。このモデルは単一GPUで動作し、OCRベンチマーク「OCRBench V2」で首位を獲得。複雑な文書から情報を高精度に抽出可能とされています。
  • また、中国向け規制回避型AIチップに関する続報として、NVIDIA が新たに「B30」という新チップを開発中と報じられています。HBMを使用しないなどの特徴を持ち、ByteDanceなどから既に受注を得ているとのことです。
  • これらの動きは、NVIDIAのAI技術におけるリーダーシップと、地政学的な制約下での市場戦略を示しています。
NVIDIA AI Developer: (翻訳) 🥇当社のNVIDIA Llama Nemotron Nano VLモデルがOCRBench V2リーダーボードで1位を獲得しました。高度なインテリジェント文書処理と理解のために設計されたこのモデルは、単一のGPUで複雑な文書から多様な情報を正確に抽出します。📗技術詳細はこちら https://t.co/YQVqR9Se4t

パウロ: トランプ大統領はNvidiaにB30を売るための裏口を与えた HBMを使用せず、バイトダンスなどから受注 ギガバイトの5月の売上は倍増する

パウロ: Nvidia 中国向けGPU発売へ 私はグラボのチップだとNVLinkは入っていないし、性能低すぎて意味ないと思いますよ 以下、引用 これらのアクセラレータは、GDDR7メモリとGB20Xシリコン(コンシューマーグレードのRTX 50 GPUと同じチップ)を使用して構築されるとのことです。

Google、Gemini基盤Deep ResearchエージェントOSS公開【続報】

  • 以前お伝えしたGoogleによるDeep ResearchエージェントのOSS実装が、「gemini-fullstack-langgraph-quickstart」としてGitHubで正式に公開されました。
  • このOSSはGeminiモデルとLangGraph、Reactを活用し、検索・反省・再検索を自律実行するリサーチエージェントを構築できます。
  • Gemini 2.5 FlashまたはProのAPIキーがあれば、引用付き調査結果を生成する機能を開発者が試せます。
  • 一部からは既存実装の再現に留まるとの声も上がっています。
まつにぃ: Google が Deep Research エージェント実装OSS をGitHubで公開しました。 「gemini-fullstack-langgraph-quickstart」は React × LangGraph で検索→反省→再検索を自律ループ可能です。 Gemini 2.5 Flash/ProのAPIキーだけで即稼働、引用付きリサーチを自作できます。 https://t.co/6O...

asap: 実装読んだけど、バックエンドは多分普通に世の中に出てるDeepResearchの再現実装の劣化版くらいなものに見える。 まあ、そのぶんすぐ読めるからわかりやすけど。 本気のやつ出して欲しかった

元OpenAI幹部も予測 2027年末迄にAIが多くのPC業務代替【続報】

  • AIによる業務自動化の予測に新たな声が加わりました。以前Anthropic幹部による2027-28年のホワイトカラー業務自動化予測をお伝えしましたが、今回は元OpenAIのAGI準備責任者とされる人物によるものです。【続報】
  • 同氏は、2027年末までにコンピュータで実行可能な経済的価値のあるほぼ全てのタスクが、AIにより効果的かつ安価に実行可能になると予測しています。
  • この見解は、影響がホワイトカラーに留まらずブルーカラーの職種にも及ぶ可能性を示唆しており、AI技術の進展が雇用構造に与える影響の大きさを改めて示しています。
Chubby♨️: (翻訳) 元OpenAI AGI準備責任者:「2027年までに、コンピューターで実行できる経済的に価値のあるほぼすべてのタスクが、コンピューターによってより効果的かつ安価に実行されるようになるでしょう。」 (引用ツイート:最近、AIの進歩のペースに触れる文章を書いていて、自分の見解を簡潔にまとめた結果がこれです:2027年末までに、コンピューターで実行できる経済的に価値のあるほぼすべてのタ...

Bindu Reddy: (翻訳) AIが人間を置き換えるのではなく、単に支援しているだけだと主張する企業の決まり文句にはうんざりです。私たちは皆、人間の仕事を置き換えるためにAIに超能力を与える競争をしています。それがまさにポイントなのです!AGIレースは、数年以内にホワイトカラーとブルーカラーの両方の仕事を置き換えるために行われています。

Kaggle IMC 2025終了、振り返り期待と技術情報共有活発化

  • 最近終了したKaggle「Image Matching Challenge 2025」では日本人参加者の活躍が目立ち、コミュニティ内で振り返りイベントへの期待が高まっています。
  • vLLM(Paged Attention)の論文解説や、Flash Attention 2と量子化を用いたメモリ使用量の検証など、実践的な技術情報も活発に共有されています。
  • コンペではDeformable Transformerを用いた特徴量記述子「RDD」などの新手法や、GPU環境でのbf16/fp16推論性能差も話題となりました。
Yu Yamaguchi | チューリング CTO: Image Matching Challenge 2025、上位に日本の方が多いので振り返り会をやってみたいですね。開催したら参加してくれる人いるかな

しんちろ: vLLM(Paged Attention)の論文読みました。 - バッチ処理 × KV キャッシュは無駄が多い。 - Paged Attention は、論理 KV ブロックと物理 KV ブロックに分けて、テーブルでマッピングすることで無駄を減らす。 - バッチ処理の前提において、高速化が可能。 https://t.co/Qu8Ibuau4a

すぐーさん(ID:sugupoko): 4位の人、RDD: Robust Feature Detector and Descriptor using Deformable Transformer使ってるう Colabで動かなくて速挫折したのやっちまった

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください