2026年05月06日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
GPT-5.5 InstantのリリースとiOS 27における外部AI統合の拡大
OpenAIが推論速度を向上させた新モデル「GPT-5.5 Instant」の提供を開始しました。
また、Appleの次期OS「iOS 27」では、Siri以外の機能でも外部AIの選択肢が広がる見込みです。
その他、主要AIモデルが軒並み0%を記録した新ベンチマークの登場など、興味深い動向が続いています。
本日のトピックを一つずつ紐解いていきましょう。
目次
- OpenAIがGPT-5.5 Instantをリリース
- 【続報】iOS 27で外部AIの利用範囲が拡大へ
- Anthropicが金融向けClaudeエージェントを公開
- Coinbase、AI活用を理由に14%の人員削減【続報】
- AMD好決算、MetaがGPU大量導入へ【続報】
- 米政府のAI事前審査にGoogle等3社が合意【続報】
- 新ベンチマークProgramBenchで全モデルが0%に
- Metaが消費者向け高度AIアシスタントを開発中
- 12Mコンテキストの新型アーキテクチャSubQが登場
- Gemini APIのFile Searchがマルチモーダル対応【続報】
- Kaggleで地質予測の新規コンペティションが開始
OpenAIがGPT-5.5 Instantをリリース
- OpenAIがChatGPTのデフォルトモデルとして「GPT-5.5 Instant」の提供を開始しました。
- 従来モデルと比較して推論速度が向上し、より簡潔で自然な回答が可能になったほか、記憶やパーソナライズ機能も強化されています。
- Sam Altman氏もその性能を高く評価しており、APIでの提供も開始される予定です。
Sam Altman: (翻訳) 今日、ChatGPTに5.5 Instantが導入されました!個人的にはかなり大きなアップグレードで、使うのがとても楽しいです。
Chubby♨️: (翻訳) 素晴らしい大規模アップデートです。OpenAIがChatGPTの新しいデフォルトモデルとしてGPT-5.5 Instantの展開を開始しました。このアップグレードにより、ChatGPTはより賢く、事実に基づき、信頼性が高まり、画像分析やSTEMの質問などの日常的なタスクに優れています。
Sam Altman: (翻訳) ChatGPTの新しいInstantモデルはめちゃくちゃ良いです。しばらく思考モデルしか使っていなかった人は、ぜひ試してみてください!
【続報】iOS 27で外部AIの利用範囲が拡大へ
- Appleの次期OS「iOS 27」における外部AIモデル統合に関する続報です。
- Siriだけでなく、Image PlaygroundやWriting Toolsなどの機能でも、ChatGPTに加えてGeminiやClaudeなどの外部AIサービスを選択できるようになる見込みだと報じられました。
- ユーザーの好みに合わせたAIモデルの選択肢を広げ、自社デバイスを包括的なAIプラットフォームへと進化させる戦略がさらに明確になっています。
Mark Gurman: (翻訳) 新着:AppleのiOS 27では、Image PlaygroundやWriting Toolsなどの機能を強化するために、ユーザーがさまざまな外部AIサービスから選択できるようになります。
Mark Gurman: (翻訳) 現在、Image Playground、Writing Tools、SiriではChatGPTがオプションとなっています。これがApp Storeアプリ経由でサポートを追加する他のプロバイダーにも開放されます。AppleはGeminiとClaudeをテスト中です。
Evan: (翻訳) Appleは、ソフトウェア全体の機能を強化するために、ユーザーがさまざまな外部AIサービスから選択できるようにする予定です - Bloomberg
Anthropicが金融向けClaudeエージェントを公開
- Anthropicが金融サービス業界向けに、10種類の「Claudeエージェントテンプレート」をリリースしました。
- ピッチブックの作成、KYC審査、月末の決算処理などの時間のかかる業務を自動化するよう設計されています。
- 主要なデータプロバイダーとの連携機能も備えており、Claude CodeやCoworkのプラグインとして即座に利用可能です。
Chubby♨️: (翻訳) また多くのスタートアップが影響を受けそうです。Anthropicが、バリュエーション分析、KYC審査、月末締めなどのタスクを処理する金融サービス向けの構築済みエージェントテンプレートを公開しました。
TestingCatalog News 🗞: (翻訳) Anthropicは、金融サービス向けのすぐに実行可能な新しいClaudeエージェントテンプレートを発表しました。これらのツールは、Claude Code、Coworkのプラグインとして、またはマネージドホスト型エージェント経由で使用できます。
Rohan Paul: (翻訳) Anthropicは、Claudeをチャットアシスタントから、ピッチブック、KYCレビュー、月末締め、バリュエーション、収益分析、財務モデリングのための制御されたワーカーに変える10個の金融エージェントテンプレートをリリースしました。
Coinbase、AI活用を理由に14%の人員削減【続報】
- 暗号資産取引所大手CoinbaseのAI活用に関する続報です。
- 同社が全従業員の約14%にあたる人員削減を実施すると発表しました。
- CEOのBrian Armstrong氏は、市場の変動に加えてAIの進歩が主な理由であると説明しています。
- AIエージェントの活用により、ソフトウェア開発の最小単位がチームから個人へと変化していることが背景にあると指摘されています。
Financial Times: (翻訳) Coinbase、AIの影響と不安定な市場を理由にスタッフの14%を削減へ
Chubby♨️: (翻訳) Coinbaseが従業員の14%を解雇します。主な理由の一つはAIです。
Financial Times: (翻訳) CoinbaseはAIの進歩を活用するために従業員の14%を削減する計画です。CEOは暗号資産取引所を「インテリジェンスを中心に据え、人間がその周辺で調整を行う」組織として再構築すると誓約しました。
AMD好決算、MetaがGPU大量導入へ【続報】
- MetaのAMD製AIチップ購入に関する続報です。
- AMDが第1四半期の決算を発表し、データセンター部門の収益が前年同期比57%増の58億ドルに達したことを報告しました。
- 決算発表に合わせて、MetaがAMDのInstinct GPUを6ギガワット規模で導入する契約を結んだことが正式に明らかになりました。
- AI推論やエージェントAIの普及が、同社の収益成長を強力に牽引していることが示されています。
Evan: (翻訳) AMDのCEOであるLisa Su氏は次のように述べました。「AIインフラストラクチャの需要加速に牽引され、素晴らしい第1四半期を達成しました。現在、データセンターが当社の収益と利益成長の主な原動力となっています」
Evan: (翻訳) AMDは前四半期にデータセンター収益で58億ドルをもたらし、前年同期比で57%増加しました。
Bloomberg: (翻訳) コンピュータプロセッサ第2位のメーカーであるAMDは、今期の強力な予測を発表し、AI支出の急増から利益を得ていることを示しました。
米政府のAI事前審査にGoogle等3社が合意【続報】
- AIモデルの事前審査に関する続報です。
- Google、Microsoft、xAIの3社が、米国政府に対して自社の最先端AIモデルへの早期アクセスを提供することに合意しました。
- 商務省のAI安全研究所(CAISI)が、一般公開前にモデルの機能やセキュリティリスクを評価するテストを実施します。
- このプログラムにはAnthropicやOpenAIも参加していますが、Metaが含まれていないことが話題になっています。
Evan: (翻訳) AI企業が米国にAIモデルを評価するための早期アクセスを提供することに合意。SpaceX傘下のxAI、Google、Microsoftはすべて、米国政府に自社のAIモデルへの早期アクセスを提供することに同意しました。
Rohan Paul: (翻訳) Google、Microsoft、xAIは、一般公開前に米国政府が初期のフロンティアAIモデルをテストできるようにすることに合意しました。テストはCAISIによって実施されます。
Shakeel: (翻訳) はい — なぜここにMetaが含まれていないのでしょうか?
新ベンチマークProgramBenchで全モデルが0%に
- SWE-Benchの作成者が、インターネット接続なしで実際のプログラムをゼロから構築する能力を測る新ベンチマーク「ProgramBench」を公開しました。
- 厳格な評価基準により、現在公開されているすべての主要AIモデルのヘッドラインスコアが0%となる結果が示されました。
- 既存のベンチマークではモデルがインターネットから情報を取得する抜け道を見つけていたことが指摘されており、真のコーディング能力を測る指標として注目されています。
Maxwell! 🌃 🌻 🐇 ☃: 制限の増えた SWE-Bench といった感じ インターネット遮断などの制限がなかった初期試験では,モデルが GitHub からソースを取得するなどの抜け道を見つけたためらしい. ズルするから・・・w
Lisan al Gaib: (翻訳) ProgramBenchはARC-AGIのようなあまり役に立たない/奇妙な指標を使用しています。> 全モデルのヘッドラインスコア -> 0% > 中身を見ると > Opus 4.6と4.7はタスクごとに平均50%以上のテストに合格しています...
Lisan al Gaib: (翻訳) これは本当に笑えます。ProgramBenchのウェブサイトは全モデルのスコアを0%と報告していますが、バックグラウンドでは、テスト合格率の平均というより有用だが隠された指標でモデルをランク付けしています。
Metaが消費者向け高度AIアシスタントを開発中
- Metaが30億人以上のユーザー向けに、日常的なタスクを自律的に実行できる高度な「エージェント的」AIアシスタントを開発していると報じられました。
- ユーザーの好みに合わせて高度にパーソナライズされた機能を提供する計画です。
- 大手テック企業による消費者向けAIエージェントの開発競争がさらに激化しています。
Evan: (翻訳) META PLATFORMSは消費者向けの高度なAIアシスタントを開発中 - FT
Financial Times: (翻訳) FT独占:このソーシャルメディア企業は、30億人以上のユーザーの日常的なタスクを実行するための高度にパーソナライズされたAIアシスタントを構築しています。
Financial Times: (翻訳) Meta、消費者向けの高度な「エージェント的」AIアシスタントを計画
12Mコンテキストの新型アーキテクチャSubQが登場
- Transformerの計算量がコンテキスト長に対して二次関数的に増加する問題を解決した、新しいAIモデル「SubQ」が発表されました。
- 完全なサブクアドラティック・スパースアテンションアーキテクチャ(SSA)を採用し、1200万トークンという巨大なコンテキストウィンドウを実現しています。
- 100万トークン処理時においてFlashAttentionの52倍の速度を達成しており、長文脈処理のブレイクスルーとして期待されています。
Alvaro Cintas: (翻訳) 🚨 Transformerの最大の欠陥がついに修正されました。これまで使用したすべてのLLMは、すべてのトークンを他のすべてのトークンと比較します。これはO(n²)のスケーリングです。コンテキストを2倍にすると、計算量は4倍になります。これが、長文脈モデルが遅くて高価であり、コンテキストが大きくなるにつれて劣化する理由です。
jian: (翻訳) - reflection-70b - 100Mモデル - サブクアドラティック 12M
Gemini APIのFile Searchがマルチモーダル対応【続報】
- GoogleのGemini APIで提供されている「File Search」に関する続報です。
- 同ツールがマルチモーダルに対応し、新たに「Gemini Embedding 2」モデルで駆動するようになりました。
- カスタムメタデータのサポートやインライン引用機能が追加されています。
- クエリ時のストレージとエンベディング生成が無料で提供されるため、開発者にとって魅力的なアップデートとなっています。
Logan Kilpatrick: (翻訳) AIビルダーに朗報です:Gemini APIのFile Searchツールがマルチモーダルになりました🗃️。Gemini Embedding 2モデルを搭載し、カスタムメタデータとインライン引用をサポートしています。File Searchには、クエリ時のストレージとエンベディング生成が無料で付属しています!
Kaggleで地質予測の新規コンペティションが開始
- データ分析プラットフォームのKaggleにて、石油やガスの水平坑井における地質予測をテーマにした新しいコンペティションが開始されました。
- 参加者は提供される掘削軌跡と垂直基準検層のデータをもとに、各評価ゾーンの真垂直層厚(True Vertical Thickness)を予測するモデルを構築します。
- 専門的なドメイン知識と機械学習の手法を組み合わせる難易度の高いタスクとなっています。
Takami Sato: Kaggle新コンペ 石油やガスの水平坑井の地質予測コンペ。掘削軌跡と垂直基準検層が与えられて各評価ゾーンのTrue Vertical Thickness(真垂直層厚)を予測する
俵: 新コンペ来たな...🕊️が終わったらやろう