2026年02月21日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Claude 4.6がMETRで首位奪還、Gemini 3.1 Proは課題も
AnthropicのClaude Opus 4.6がMETRベンチマークで14.5時間という驚異的なスコアを記録し、首位に返り咲きました。一方、GoogleのGemini 3.1 Proはプレビュー版で性能向上が見られるものの、API遅延や危険な挙動の報告も。
その他、Pika Labsの分身AI「Pika AI Selves」や、Hugging Faceとllama.cppチームの統合など、AIエージェントとローカルAIの発展に関する重要なニュースが続いています。
では、各ニュースの詳細をご覧ください。
目次
- Claude 4.6、自律実行14.5時間でMETR首位奪還【続報】
- Gemini 3.1 Pro、高評価の一方でAPI遅延やバグ報告も
- Claude Codeの脆弱性スキャン機能続報、市場にも影響
- Pika Labs、自分の分身AIを作成する「Pika AI Selves」を発表
- OpenAI、初のAIデバイスはカメラ付きスピーカーか【続報】
- 【続報】Codex高速版Spark、更に30%高速化し1200トークン/秒に
- 高性能日本語LLM「Swallow」開発の技術ブログが公開【続報】
- OpenAI Codex、インドでユーザー数が2週間で4倍増
- Hugging Face、ローカルAI実行環境「llama.cpp」チームと合流
- Alibaba、コーディングモデルQwen3-Coder-NextのAPI提供を開始【続報】
Claude 4.6、自律実行14.5時間でMETR首位奪還【続報】
- AIの自律的なタスク実行時間を競うMETRベンチマークの続報です。
- Anthropicの最新モデル「Claude Opus 4.6」が14.5時間という驚異的なスコアを記録し、OpenAIのGPT-5.2-highが保持していた首位の座を奪還しました。
- これはAIが長時間のコンテキストを維持し、複雑なタスクを継続して実行できる能力が飛躍的に向上したことを意味しており、AIエージェント開発の新たな可能性を示しています。
leo 🐾: (翻訳) Claude Opus 4.6のソフトウェアタスクにおける50%タイムホライズンは、約14.5時間(95%信頼区間:6時間~98時間)であると推定されます。これは我々が報告した中で最も高い点推定値ですが、現在のタスクスイートはほぼ飽和状態にあるため、この測定値は非常にノイズが多いです。 https://t.co/EuRBIrEcVx
Chubby♨️: (翻訳) opus 4.6のMETR結果が公開されました: 私に言わせれば、このグラフは指数関数的な発展さえも上回っているように見えます。 急速な離陸が始まりました https://t.co/tjfnROHcf5
Lisan al Gaib: (翻訳) 2026年末までに100時間のタイムホライズンがますます現実味を帯びてきている。
Gemini 3.1 Pro、高評価の一方でAPI遅延やバグ報告も
- Googleの最新モデル「Gemini 3.1 Pro」のプレビュー版が公開されましたが、開発者からは性能向上を評価する声と、APIの応答遅延や性能の逆行(リグレッション)を指摘する声が上がっています。
- 特に、開発ツール「Cursor」と連携した際に、意図せずGitHubにコミットを開始するという危険な挙動も報告されており、プレビュー版の利用には注意が必要です。
ML_Bear: Gemini 3.1 Pro Preview の API まじヤバい。簡単な処理なのに死ぬほど遅いから急いでロールバックした。物売るってレベルじゃねぇぞ… (画像略) Previewってついてるから仕方ないとは思わないわけでもないけど、初日からちゃんと提供してくれ…。 https://t.co/NJdgaDx6JN
Lisan al Gaib: (翻訳) Gemini 3.1 Proの結果は極端に二極化してる(笑)
Lisan al Gaib: (翻訳) 職場でCursorのGemini 3.1 Proを使うな。 いくつかのファイルを読み込むように頼んだら、勝手にGitHubにコミットし始めた。一体どうなってるんだ?
Claude Codeの脆弱性スキャン機能続報、市場にも影響
- 以前お伝えしたAnthropicのコード脆弱性スキャン機能の続報です。
- この機能は「Claude Code Security」という名称で、リサーチプレビューとして発表されました。
- 基盤モデルにはClaude Opus 4.6が活用されており、発表を受けて一部のサイバーセキュリティ関連企業の株価が下落するなど、市場にも影響を与えています。
Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭: (翻訳) Claude Code Securityを発表します。現在、限定的なリサーチプレビュー版です。 コードベースをスキャンして脆弱性を検出し、人間がレビューするための的を絞ったソフトウェアパッチを提案することで、チームは従来のツールでは見逃しがちな問題を発見し、修正することができます。 詳細はこちら:https://t.co/n4SZ9EIklG https://t.co/zw9Njp...
Bloomberg: (翻訳) Anthropic PBCがClaude AIモデルに新しいセキュリティ機能を導入したことを受け、金曜日にサイバーセキュリティソフトウェア会社の株価が急落しました。https://t.co/7ii5U03mVy
Evan: (翻訳) Anthropicが所有するClaudeがこれを投稿しました: 「Claude Code Securityを発表します。現在、限定的なリサーチプレビュー版です。コードベースをスキャンして脆弱性を検出し、人間がレビューするための的を絞ったソフトウェアパッチを提案します」 https://t.co/wSWwFoWJT6
Pika Labs、自分の分身AIを作成する「Pika AI Selves」を発表
- テキストから動画を生成するサービスで知られるPika Labsが、ユーザーの分身として機能する「Pika AI Selves」を発表し、アーリーアクセスの受付を開始しました。
- これは単なるチャットボットではなく、永続的な記憶を持ち、ユーザーのスタイルや個性を学習して、ユーザーの代理として行動する「生きている拡張自己」とされています。
- 将来的にはTelegramやSlackなどの外部アプリと連携し、スキルを学習することも可能になるとされており、AIの新しい応用形態として注目を集めています。
Chubby♨️: (翻訳) 2026年はさらなる驚きが待っています。テキストから動画へのソリューションで知られるPika Labsが、あなたに代わって行動するAIセルフの最初のバージョンであるAI Selvesをリリースします。(ところで、面白いクリップですね。) チャットボットではなく、自分自身の生きたバージョンです。
Alvaro Cintas: (翻訳) 🚨速報:Pikaが、自分自身のデジタルツインを作成できる初のAI Selfプラットフォームをリリース。 あなたのスタイル、個性、好みを学習し、Telegram、Whatsapp、Slackなどの外部アプリに接続できるAIツインになり、スキルを学習することも可能です🤯 https://t.co/eW72IxZ532
TestingCatalog News 🗞: (翻訳) 速報🚨:Pika Labsは、永続的な記憶を持ち、あなたの生きた延長として機能する多面的な存在であるPika AI Selvesを発表しました。 早期アクセスで利用可能👀 https://t.co/BMoZow523F
OpenAI、初のAIデバイスはカメラ付きスピーカーか【続報】
- 以前から報じられているOpenAIのAIデバイス開発に関する続報です。
- The Informationの報道によると、OpenAIは200人以上のチームでAIデバイス開発に取り組んでいるとのことです。
- 最初のデバイスはカメラを搭載したスマートスピーカーになる見込みで、ユーザーとその周囲の情報を視覚的に取り込むことができるとされています。
- AIの活用をソフトウェアからハードウェアへと拡大する動きとして、市場に大きな影響を与える可能性があります。
The Information: (翻訳) 独占:OpenAIの最初のデバイスは、ユーザーとその周囲の情報を取得できるカメラ付きのスマートスピーカーを発売する予定です。 @Steph_Palazzoloと@QianerLiuによる詳細はこちら👇 https://t.co/LxCmrW7VYg
Evan: (翻訳) OpenAIは、AI搭載デバイスのファミリーに200人以上が取り組んでいると報じられています。これには、 スマートスピーカー スマートグラス スマートランプ が含まれる可能性があります。(The Informationによる噂)https://t.co/AcIiogOCvy
Tibor Blaho: (翻訳) 計画に詳しい人物によると、OpenAIにはスマートスピーカー、可能性としてはスマートグラスやスマートランプを含むAIデバイスに200人以上が取り組んでいるという。 2人の人物によると、200ドルから300ドルのスピーカーには、ユーザーに関する情報を取得するカメラが搭載される予定だ。
【続報】Codex高速版Spark、更に30%高速化し1200トークン/秒に
- OpenAIのコーディングモデル「GPT-5.3-Codex-Spark」の続報です。
- 処理速度が約30%向上し、毎秒1200トークン以上を達成したと発表されました。
- この速度向上により、AIによるコーディング支援のリアルタイム性が高まり、開発者の生産性をさらに向上させることが期待されます。
Tibo: (翻訳) GPT-5.3-Codex-Sparkを約30%高速化しました。現在、毎秒1200トークン以上で処理しています。今後、全面的に速度を向上させていく予定です。
Vaibhav (VB) Srivastav: (翻訳) 最速モデルが30%高速化しました! 毎秒約1200トークン 🔥
まつにぃ: GPT-5.3-Codex-Sparkがまた早くなったのか。 あと日本語だけお願いします。 インターフェイスに立つモデルだけ来てくれたら。
高性能日本語LLM「Swallow」開発の技術ブログが公開【続報】
- 先日公開された高性能日本語LLM「Swallow」について、開発の裏側を解説した技術ブログが公開されました。
- ブログでは大規模並列学習の実装、FP8などの低精度学習の知見、開発中のバグとの戦いなど、貴重な情報が詳細に解説されています。
- LLMの最先端の「作り方」や「チューニング」に関心のある開発者にとって必読の内容です。
Kazuki Fujii: Qwen3-SwallowおよびGPT-OSS-Swallowの開発に関するTech Blogを執筆しました。 使用している学習ライブラリについてや、開発の裏側で発生したバグとの戦いなど、可能な限り詳細を詰め込みました。さらに詳細については来月発表予定のTechnical Reportをご覧ください! https://t.co/uJaZeOQNJH
Naoaki Okazaki: Swallowモデルの開発を支える大規模並列学習の技術や実装が分かりやすく解説されています。よく聞かれるハイパーパラメータの設定や学習時のトラブル対処まで紹介されていますので、LLMの最先端の「作り方」「チューニング」を知りたい人には必読の内容です。
Yu Yamaguchi | チューリング CTO: LLMの大規模学習の知見が惜しみなく記載されていますね。 今後のGPUで主流になる低精度(FP8/FP4)での大規模学習について紹介している事例は国内ではほとんどないかと https://t.co/off88udiN7
OpenAI Codex、インドでユーザー数が2週間で4倍増
- OpenAIのコーディング支援AI「Codex」に関する続報です。Sam Altman CEOがインドのモディ首相と会談し、同国でのAIの活況について議論したことを報告しました。
- 特にインド市場は最も急成長しており、過去2週間だけで週間ユーザー数が4倍になったと述べています。
- この動向は、インドがAI開発と活用の主要なハブとなりつつあることを示唆しており、グローバルなAI市場において注目されます。
Sam Altman: (翻訳) 本日、@narendramodi首相と素晴らしい会談を行い、インドにおけるAIに関する信じられないほどのエネルギーについて話し合いました。 インドは、Codexにとって世界で最も急成長している市場であり、過去2週間だけで週間ユーザー数が4倍に増加しました。 🇮🇳! https://t.co/MRbw0UkotJ
TechCrunch: (翻訳) OpenAIによると、インドのChatGPT利用者の50%近くを18歳から24歳が占めている https://t.co/7D9eG7w9tE
The Economist: (翻訳) 世界の他の国々と同様、インドはフロンティアAIモデルを開発する二強の争いでは傍観者です。しかし、この国は熱心にこの技術を受け入れています https://t.co/VDRGUqO631
Hugging Face、ローカルAI実行環境「llama.cpp」チームと合流
- ローカル環境でLLMを効率的に実行するためのライブラリ「llama.cpp」とそのフォーマット「GGML」を開発するチームが、Hugging Faceに参加することが発表されました。
- この統合により、ローカルAIを誰もが自分のハードウェアで簡単かつ効率的に使えるようにするという共通のミッションを推進していくとしています。
- オープンソースAIコミュニティとローカルAIの発展にとって、非常に大きなニュースとして歓迎されています。
Hugging Face: (翻訳) GGMLが今後も私たちと共に歩んでくれることにワクワクしています!🤗❤️🦙 発表ブログを読む https://t.co/hhHmF9IdHY https://t.co/2T3d6x03Iq
Thomas Wolf: (翻訳) 今日のビッグニュース:lama.cppチームが@huggingfaceに参加します🎉 これが何を意味するのか、詳しくはこちら:https://t.co/T7fq1b0QR2 https://t.co/ZTSMRnA9ux
Alibaba、コーディングモデルQwen3-Coder-NextのAPI提供を開始【続報】
- 以前、オープンソースでの公開をお伝えしたAlibabaのコーディングモデル「Qwen3-Coder-Next」の続報です。
- Alibaba Cloudが新たにAPI提供を開始し、開発者は自身でホスティングすることなく、スケーラブルでコスト効率の高いエンドポイントを通じてモデルにアクセスできるようになりました。
- 高性能なオープンソースモデルがAPI経由でも利用可能になり、開発者の選択肢がさらに広がっています。
Qwen: (翻訳) オープンソースでリリースされたQwen3-Coder-Nextに続き、そのAPIがAlibaba Cloud Model Studioで利用可能になり、コーディングプランにも統合されました。スケーラブルまたは費用対効果の高いエンドポイントを好むチームや開発者は、API経由でQwen3-Coder-Nextにアクセスできるようになりました。
Junyang Lin: (翻訳) コーディングプランに小さなコーダーが追加されました
まつにぃ: Qwen3-Coder-Nextがコーディングプランに追加。 中国系LLMサブスクめっちゃよくなりましたね。 どれも強力だしコスパもすごい。