2026年02月22日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
ベンチマーク競争と動画AI延期、Microsoftゲーム部門にAI出身トップ
METRベンチマークでClaude 4.6が首位を維持し、GPT-5.3-Codexは6.5時間と評価されました。一方、期待されていたSeedance 2.0のAPI公開が著作権対応のため無期延期に。
Microsoftゲーム部門では38年勤務のSpencer氏が退任し、AI担当幹部Sharma氏が新CEOに就任。質の高いAI活用を約束しています。
では、今日のトピックを詳しくご紹介します。
目次
- Claude Codeデスクトップ版にアプリプレビュー機能追加
- METRベンチマーク、Claude 4.6が首位維持 GPT-5.3-Codexは6.5時間
- ChatGPT、新プラン「Pro Lite」も準備中か
- Gemini 3.1 Pro、ベンチマーク記録更新も実用面の課題は残る
- MSゲーム部門新トップ、AIの質の高い活用を約束
- OpenAI製AIデバイス 発売は2027年以降に延期か
- 【続報】動画生成AI「Seedance 2.0」API公開、著作権問題で無期延期
- NotebookLM、スライド改訂機能が正式リリース
Claude Codeデスクトップ版にアプリプレビュー機能追加
- AIコーディングアシスタント「Claude Code」のデスクトップ版に関する続報です。
- 開発サーバーを起動してアプリのプレビューをリアルタイムで表示する機能や、コードレビュー、CI/CDの失敗をバックグラウンドで処理する機能が追加されました。
Boris Cherny: (翻訳) Claude Codeデスクトップチームからの大規模なリリースです。私たちはしばらくの間これをドッグフーディングしてきましたが、皆さんに試していただくのが待ちきれません。
Oikon: Claude Code のデスクトップ版が大幅にアップデート。大きく分けて4つの機能が入りました。 1. Server Preview機能: デスクトップ内でdevサーバーを自動起動して、プレビュー画面を表示できるように(CursorのBrowser tabに近い)。Preview内のコンポーネントを指定して指示も可能。 2. https://t.co/hMTXONQdZq
cat: (翻訳) Webアプリを反復開発するための新しい最速の方法です!
METRベンチマーク、Claude 4.6が首位維持 GPT-5.3-Codexは6.5時間
- AIエージェントの自律実行時間を測るMETRベンチマークの続報です。
- 新たに追加されたOpenAIのGPT-5.3-Codexは6.5時間と評価され、AnthropicのClaude Opus 4.6が持つ14.5時間の記録には及ばず、首位は維持されました。
- 一部からは、現在のベンチマークが飽和状態にあり、モデル間の真の能力差を正確に反映していない可能性も指摘されています。
Lisan al Gaib: (翻訳) GPT-5.3-Codex METR: 6時間30分 GPT-5.2-high: 6時間34分 Claude 4.6 Opus: 14時間30分 Anthropicの勝利
松本 勇気 (Yuki Matsumoto) | LayerX CTO: Agentが自律的に実行できるタスク時間の伸び凄まじい。 12月にOpus4.5で4.49時間、2月にOpus4.6で14.5時間のタスクを50%の成功率でこなせるようになった。12月から明らかに進化のスピードが一段変わった。 https://t.co/0rMwTiaC63
Lisan al Gaib: (翻訳) GPT-5.3-CodexとOpus 4.6の最後の2つのMETR結果をあまり深刻に受け止めないでください。ベンチマークは明らかに限界に近いです。GPT-5.3-CodexとOpus 4.6はどちらも素晴らしいモデルです。両モデルの真のp50タイムホライズンが本当にそれほど離れているとしたら、私は非常に驚くでしょう。
ChatGPT、新プラン「Pro Lite」も準備中か
- 先日の「ChatGPT Go」に続き、新たに「ChatGPT Pro Lite」という料金プランの記述がコード内から発見されました。
- 現在のPlusプラン(月額20ドル)と、より高機能なProプランの間に位置する、月額50ドル程度のプランではないかと推測されています。
- コーディング用途などに特化したプランの可能性も議論されており、今後の公式発表が待たれます。
Tibor Blaho: (翻訳) ChatGPTのウェブアプリのコードに、新しい「ChatGPT Pro Lite」プランへの言及が見つかりました。
Lisan al Gaib: (翻訳) 50ドルか100ドルのChatGPTプランが登場するようだ
まつにぃ: GPT Pro Liteという半チャーハン大盛りプランが来そうです。 Codex専用君かな?
Gemini 3.1 Pro、ベンチマーク記録更新も実用面の課題は残る
- 先日発表されたGoogleのGemini 3.1 Proに関する続報です。
- 一部のベンチマークで新記録を達成するなど理論性能の高さが示される一方、実用面では期待ほどの性能が出ていないとの声が上がっています。
- 特にAPIの安定性に課題があり、Vertex AI経由での利用はまだ不安定との報告が複数見られます。
Bindu Reddy: (翻訳) Gemini 3.1は良いモデルですが、ベンチマークが示すほどではありません。実世界の品質評価ではSonnet 4.6を下回っています。とはいえ、価格は非常によく、全体としてAnthropicモデルを下回っています。
Lisan al Gaib: (翻訳) 我々は戻ってきた
ML_Bear: Gemini 3.1 Pro Preview の Google AI Studio 側は安定してきた。Vertex AI 側はまだボロボロらしい。Googleさん、そういうとこやぞ…。 https://t.co/92v2c2dZCy https://t.co/UNfmw5xhuH
MSゲーム部門新トップ、AIの質の高い活用を約束
- Microsoftのゲーム部門(Xbox)責任者であるPhil Spencer氏が38年の勤務を経て退任、後任にAI担当幹部のAsha Sharma氏が就任します。
- Sharma氏はInstacartから2024年にMicrosoftに入社した人物です。
- 新CEOは就任にあたり、ゲームを「無限のAIスロップ」で溢れさせることはないと述べ、質の高いAI活用を目指す姿勢を示しました。
Evan: (翻訳) マイクロソフトのゲーム部門責任者フィル・スペンサー氏が38年間の勤務を終え退社する。2024年にインスタカートからマイクロソフトに入社したアシャ・シャルマ氏がゲーム部門の責任者を引き継ぐ - CNBC
Bloomberg: (翻訳) マイクロソフト社は、フィル・スペンサー氏の後任として、AI担当幹部のアシャ・シャルマ氏をXboxおよびゲーム事業の責任者に任命し、モバイルおよびPCプレイヤー向け製品を長年開発してきた後、コンソールユーザーへの再コミットを行うと発表した。
TechCrunch: (翻訳) マイクロソフトの新しいゲーム部門CEOは、エコシステムを「無限のAIスロップ」で溢れさせないと誓う
OpenAI製AIデバイス 発売は2027年以降に延期か
- OpenAIが開発中とされるAIデバイスに関する続報です。
- The Informationが報じたところによると、発売は2027年まで行われない可能性があるとのことです。
- 以前報じられた2026年後半の発表計画から、さらに遅れる可能性がでてきました。
The Information: (翻訳) OpenAIは新しいハードウェアデバイスのファミリーを開発しています。最初のリリースに関する詳細:「基本的には、これはカメラを搭載した一種のスマートスピーカーで、音声とビデオを取り込み、周囲で何が起こっているかを見ることができます。」「価格はおそらく200ドルからになるでしょう」
The Information: (翻訳) OpenAIには、AI搭載デバイスのファミリーに取り組んでいる200人以上の従業員がいます。このグループとその開発戦略に関する新しい詳細が明らかになり始めています。OpenAIのデバイスの背後にいる頭脳に関するThe Informationの独占レポートをお読みください。
The Information: (翻訳) OpenAI初のデバイス、200〜300ドルのカメラ付きスマートスピーカーは、2027年まで出荷されない可能性がある。
【続報】動画生成AI「Seedance 2.0」API公開、著作権問題で無期延期
- 先日発表されたByteDanceの動画生成AI「Seedance 2.0」のAPI公開が、無期限で延期されることが明らかになりました。
- 延期の理由は、著作権法を遵守するためにより厳しい制限を設けるためと説明されています。
- 最高峰の動画生成モデルとして期待されていただけに、クリエイターや開発者への影響が懸念されます。
Legit: (翻訳) Seedance 2.0 APIが遅延しました😢 世界的なローンチは、著作権法を尊重するためにより厳しい制限が課される間、無期限に延期されました。
TestingCatalog News 🗞: (翻訳) Seedance 2.0 APIのローンチは、著作権の制限により遅れる可能性があります。当初、目標ローンチ日は2月24日に計画されていました。Seedance 2.0は、現在利用可能な最高のビデオ生成モデルです。
NotebookLM、スライド改訂機能が正式リリース
- 以前から開発が示唆されていた、GoogleのAIノートツール「NotebookLM」のスライド改訂機能が、全ユーザーに正式に展開されました。
- この「Slide Revisions」機能により、プロンプトを使ってスライドのテキストやデザインを修正できます。
- また、モバイルアプリでは動画の概要をカスタマイズする機能も追加され、情報整理の利便性がさらに向上しています。
NotebookLM: (翻訳) スライドの改訂機能が、ついに全ユーザーに正式に展開されます!🥳 ビジネス用のスライドデッキを作成する場合でも、ソースを楽しいストーリーブックに変える場合でも、プロンプトベースの改訂機能を使用して、各スライドのテキスト、色、ビジュアルが必要なものと完全に一致するようにしてください。
NotebookLM: (翻訳) また、NotebookLMモバイルアプリでビデオの概要をカスタマイズできるようになりました! どうせみんなスマホでビデオを見ているのですから…教育的で、情報源に基づいた、(そしてカワイイ!)ものにしてみませんか💕
The Information: (翻訳) GoogleのNotebookLMやReplitのようなツールを使えば、経営幹部も開発の現場に戻ってきています。