2026年05月08日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
OpenAIの特化型モデル公開とAnthropicの資金調達動向
OpenAIからセキュリティ特化モデル「GPT-5.5-Cyber」が公開され、AIエージェントの普及に伴うトークン消費の急増が新たな課題として浮上しています。
また、AnthropicのClaude MythosがFirefoxのバグ修正で大きな成果を上げ、同社の評価額が1兆ドルに迫る資金調達の動きも報じられています。
本日の主要なトピックを順番にご紹介します。
目次
- Codex拡張機能の反響とハーネスエンジニアリング解説【続報】
- GPT-Realtime-2の性能評価や導入事例が公開【続報】
- OpenAIがGPT-5.5-Cyberを限定プレビュー公開【続報】
- AIエージェントによるトークン消費爆発と新課題【続報】
- Claude MythosがFirefoxのバグ修正に貢献【続報】
- Anthropic評価額1兆ドル迫る、xAIからGPU借用も【続報】
- NVIDIA中国向け特別版計画とタイ企業の密輸支援疑惑
- Devin for TerminalとSWE-1.6の高速動作が話題
- Grok VoiceがApple CarPlayに対応【続報】
- AnthropicがClaudeの「Skills」活用ガイドを無料公開
- Kaggleでプライベートハッカソンが実施可能に
- Mojoがオープンソース化
Codex拡張機能の反響とハーネスエンジニアリング解説【続報】
- OpenAI CodexのChrome拡張機能に関する続報です。
- macOSおよびWindows向けにリリースされた同機能が、多くの開発者から絶賛されています。
- バックグラウンドでの複数タブ操作やサブエージェントとの組み合わせにより、ブラウザ作業が劇的に効率化されると報告されています。
- また、OpenAIからエージェントファーストの世界における「ハーネスエンジニアリング」に関するブログ記事も公開されました。
Greg Brockman: (翻訳) CodexがバックグラウンドでChromeのタブを操作できるようになりました:
Romain Huet: (翻訳) CodexにmacOSとWindows向けのChrome拡張機能が登場しました!素晴らしいのは、ブラウザを使い続けながらバックグラウンドでログイン済みのウェブサイトを操作でき、Chromeとプラグインなどの他のツールを組み合わせてタスクを完了できる点です。
Jun Naito / 内藤 純: 魑魅魍魎なSNSの情報ではなくてちゃんと一次情報見にいくようにしよう ハーネスエンジニアリングちゃんと整理してブログにまとめよう ハーネスエンジニアリング:エージェントファーストの世界における Codex の活用 | OpenAI https://t.co/c2eeLgekxb
GPT-Realtime-2の性能評価や導入事例が公開【続報】
- OpenAIの音声モデル「GPT-Realtime-2」などに関する続報です
- Big Bench Audioで15ポイントの改善が見られたと報告されています
- Gensparkなどのアプリにいち早く導入されたほか、公式のプロンプトガイドも公開されました
- 一方で、APIの利用コストの高さや計算資源の大量消費への懸念も議論されています
Justin Uberti: (翻訳) gpt-realtime-2はBig Bench Audioで(1.5と比較して)15ポイントの改善を示し、現在飽和状態に近づいています。
Genspark: (翻訳) 🚀 GPT-Realtime-2がGensparkに導入されました。私たちのCall for Meエージェントは現在これで稼働しています。次はGenspark Realtime Voiceのアップグレードです。Realtime 2がもたらすもの:より鋭い推論。より厳密な指示の遵守。有効な会話率が+26%。通話の切断が大幅に減少。
OpenAI Developers: (翻訳) GPT-Realtime-2で音声アプリケーションを構築していますか?私たちの新しいプロンプトガイドでは、推論の労力の調整、プリアンブルの使用、ツールの動作の設計、不明瞭な音声の処理、正確なエンティティのキャプチャ、および長時間のセッションでの状態の維持について説明しています。
OpenAIがGPT-5.5-Cyberを限定プレビュー公開【続報】
- OpenAIのサイバーセキュリティ特化モデル「GPT-5.5-Cyber」に関する続報です。
- 重要インフラの防御担当者向けに、同モデルの限定プレビューが公開されました。
- Sam Altman氏らも、企業が自らを保護するための支援としてこのモデルの重要性を強調しています。
- なお、開発者向けには引き続き「GPT-5.5 with TAC」が脆弱性発見の最良の選択肢として提供されます。
Shakeel: (翻訳) 繰り返しになりますが、OpenAIの誰かに、この展開がMythosのものとどう違うのか説明してほしいです。
Sam Altman: (翻訳) 私たちは企業が自らを守るのを支援したいと考えており、これに迅速に取り組み始めることが重要だと考えています。
Greg Brockman: (翻訳) GPT-5.5-Cyberは現在、重要インフラを保護する防御担当者向けに限定プレビューで提供されています。非常に有能なモデルです。
AIエージェントによるトークン消費爆発と新課題【続報】
- AIエージェントのコスト増に関する続報です。
- Databricks AIのエンジニアによると、OpenAIのトップチームでは1日に数百億トークンを消費していると報告されています。
- エージェントの連続稼働により、開発現場でのトークン消費量が爆発的に増加しています。
- 隠れた推論ステップによる予算の枯渇や、生成された大量のコードによる技術的負債の増大など、新たな課題も浮き彫りになっています。
Yuchen Jin: (翻訳) OpenAIの何人かが私に言いました。「1日3億トークンは初心者の数字だ」。私が今聞いている最大の数字は1日570億トークンです!ごめんなさい、私はあなたたちのゲームに詳しくありませんでした。GPUをフル稼働させる(推論)のが得意な方はDMをください。Databricks AIには無制限のトークンがあります!
Bindu Reddy: (翻訳) 1日に無限のトークンを消費してループを回すことは、極度の脳の腐敗につながります。AIが1万行のコードを生成すると、エンジニアは何が起こっているのか全く分からなくなります。バグは増殖し、AIの負債は制御不能になり、稼働率は低下します。
Kol Tregaskes: (翻訳) 継続的なエージェントのループは、出力トークンを急速に消費する可能性があります。- 隠された推論ステップは、価値を見出す前に予算を枯渇させます。- API呼び出しと計算コストは、標準的なチャットをはるかに超えて急増する可能性があります。- 出力コストは予測が難しく、制御するのはさらに困難です。
Claude MythosがFirefoxのバグ修正に貢献【続報】
- AnthropicとMozillaの協力によるFirefoxのセキュリティバグ修正に関する続報です。
- Claude Mythos Previewの支援により、Firefoxチームが4月に修正したバグ数が過去15ヶ月分の合計を上回ったことが報告されました。
- 圧倒的な成果を上げる一方で、CEOのDario Amodei氏はMythosのスケールアップにおける課題について言及しています。
- 計算資源ではなく、サイバーリスクの観点からのアクセス制限が今後の課題になると述べています。
Oikon: Claude Mythos Previewによって修正されたFirefoxのセキュリティバグの数が圧倒的。
Haider.: (翻訳) Dario Amodei氏は、Mythosは計算資源によって制限されていないと述べています。Anthropicは、政府と民間部門のアクセスの間に競合を生じさせることなく、それを3倍または10倍にスケールアップできます。より難しい問題は、誰がそれを手に入れるかです。「あまりにも多くの組織にアクセスを与えると、深刻なサイバーリスクを引き起こす可能性があるため」です。
Anthropic評価額1兆ドル迫る、xAIからGPU借用も【続報】
- Anthropicの資金調達に関する続報です。
- 収益が急増する中、評価額1兆ドル近くでの新たな資金調達を検討していると報じられました。
- 計算資源の確保に奔走しており、xAIからGPUを借り受けているという驚きの動きも観測されています。
- 競合他社との激しい開発競争の中で、さらなる事業拡大を目指していると見られます。
Lisan al Gaib: (翻訳) 「数年以内に」というのは、1年以内のことですね
Haider.: (翻訳) イーロンがxAIのGPUをAnthropicに貸し出すのは、双方にとって驚くべき動きです。これは、OpenAIがgpt-5.5とcodexでプレッシャーをかける中、Anthropicがプレミアムを支払ってでも容量をひどく必要としていることを示唆しています。もしClaudeのリードが安全であれば、Anthropicはより多くの計算資源を購入する代わりに、使用量の制限を維持するでしょう。
Financial Times: (翻訳) Anthropic、収益急増に伴い評価額1兆ドル近くでの取引を検討
NVIDIA中国向け特別版計画とタイ企業の密輸支援疑惑
- NVIDIAが中国市場向けに次世代GPU「Rubin」と「Blackwell」の特別版を投入する計画があるとの噂が広まっています。
- この影響を受け、中国国内の計算機関連株で調整の動きが見られました。
- また、タイのAI企業がNVIDIA製チップの中国への密輸を支援した疑いで、米国検察の調査を受けていることも新たに報じられています。
Jukan: (翻訳) 笑、NVIDIAが中国向けのRubinとBlackwellの特別バージョンを発売する計画があるという噂が広まった後、今日の中国の国内計算機関連のA株は調整されました。
Bloomberg: (翻訳) 米国の検察官は、タイのAI企業がNvidiaチップの中国への密輸を支援したと疑っていると言われており、Alibabaは複数の最終顧客の1つです。
Devin for TerminalとSWE-1.6の高速動作が話題
- Cognitionが提供するDevin for TerminalとSWE-1.6の組み合わせが、非常に高速に動作すると開発者の間で評価されています。
- 昔のUIよりも整理されて使いやすくなっており、再び様々なテストを行うユーザーが増えています。
Oikon: 最近、個人的に使っていて面白くなっているのがCognitionのサービス Devin for Terminal + SWE-1.6が高速で結構使いやすい。 Devin 自体も昔のUIより整理されて使いやすくなっているので、最近はまた色々試してます。 https://t.co/nGwitAoLOw
Oikon: SWE-1.6 Fast トテモ速イ⚡️ (動画は等倍速) https://t.co/BvR8jPWACd
Grok VoiceがApple CarPlayに対応【続報】
- 以前報じられたCarPlayでのサードパーティ製AIアプリ許可の動きに関連する続報です。
- xAIのGrok VoiceがApple CarPlayで利用可能になり、運転中もハンズフリーでの対話が可能になりました。
- ユーザーからは、地図の操作などさらなる機能拡張を期待する声が上がっています。
Tech Dev Notes: (翻訳) Grok VoiceがCarPlayで利用可能になりました
ML_Bear: GrokがCarPlayから使えるようになるらしい👀 ええやん!地図の操作とかできるようになってくれないかなぁ。 https://t.co/ZPghSiLvnx
AnthropicがClaudeの「Skills」活用ガイドを無料公開
- Anthropicが、Claudeの「Skills」フォルダを活用するための33ページにわたるプレイブックを無料で公開しました。
- プロンプトエンジニアリングからシステム構築への移行を促す内容となっており、有益な資料として注目を集めています。
Charly Wargnier: (翻訳) Anthropicがこの33ページのガイドを無料で公開するのを見ている、999ドルの「AIマスタリー」コースの作成者たち
Kaggleでプライベートハッカソンが実施可能に
- Kaggleにおいて、社内や授業向けに非公開のプライベートハッカソンを実施できる機能が追加されました。
- クローズドな環境でコンペティションを開催したいユーザーにとって待望の機能となります。
カレーちゃん: Kaggleでプライベートハッカソンを実施可能になった。 社内・授業とか、非公開にやりたい人向け。
Mojoがオープンソース化
- AI開発向けプログラミング言語「Mojo」がオープンソース化されたことが話題になっています。
- 開発者コミュニティからの貢献が容易になり、今後のエコシステム拡大が期待されます。
mizchi: mojo オプソになってんじゃん https://t.co/1UGbhKJTCt