2025年11月18日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
xAIとOpenAIの性能競争が激化、Bezos氏がAI業界に復帰
xAIの「Grok 4.1」がLMArenaで首位を獲得した直後、OpenAIの「GPT-5.1」がARC-AGIベンチマークで最高性能を更新。トップモデルの座を巡る競争が一層激しくなっています。
一方、Amazon創業者のJeff Bezos氏が新AI企業「Project Prometheus」のCEOとして現場復帰を発表。また、CloudflareによるReplicate買収など、AI開発インフラの強化も進んでいます。
では、各トピックの詳細を見ていきます。
目次
- xAI、新モデル「Grok 4.1」発表 LMArenaで首位
- 【続報】GPT-5.1、ARC-AGIベンチマークでGrok 4超え
- Gemini 3の噂が錯綜、性能低下の懸念も【続報】
- Jeff Bezos氏、新AI企業PrometheusでCEO復帰
- Cloudflare、AIモデル実行プラットフォームReplicateを買収
- Google、研究アイデアを自動生成するマルチエージェントシステム開発中
- Google DeepMind、高精度な気象予測AI「WeatherNext 2」発表
- GoogleのAI Studio、来年初めにモバイルアプリ提供へ
- Kaggle、恒例のサンタ最適化コンペを開始
xAI、新モデル「Grok 4.1」発表 LMArenaで首位
- xAIから最新モデル「Grok 4.1」がリリースされました。
- リリース直後から、コミュニティ運営のLLMリーダーボード「LMArena」でトップスコアを記録し、その性能の高さが注目されています。
- 思考(Thinking)モードの有無でモデルが分かれているほか、API経由で特定の情報を取得する機能も備えています。
TestingCatalog News 🗞: (翻訳) Grok 4.1に関する記述がコード内で発見されました👀\n\n- grok-4-1-non-thinking-w-tool\n- grok-4-1-non-thinking-no-tool-1111b https://t.co/i3LmOGIqYE
Kol Tregaskes: (翻訳) Grok 4.1 が出ました! https://t.co/5Rl72GkcMR
Tech Dev Notes: (翻訳) Grok 4.1 ThinkingがLMArenaテキストリーダーボードで1位にランクイン! https://t.co/YbUEXs3bRB
【続報】GPT-5.1、ARC-AGIベンチマークでGrok 4超え
- OpenAIの最新モデル「GPT-5.1」が、難解な推論能力を測るベンチマーク「ARC-AGI 2」でxAIのGrok 4を上回り、最高性能(SOTA)を達成しました。
- これは先日報告されたGPT-5 Proのスコアをさらに更新する結果となります。
- 特に「思考(Thinking)」モードを備えた高コスト版が、その高い能力を示すスコアを記録しています。
Chubby♨️: (翻訳) 新しいリーダーボードのリーダー ARC-AGI 2: GPT-5.1 High、17.64%\n\n続いてGrok 4 heavy https://t.co/IcWotwWDb4
Lisan al Gaib: (翻訳) GPT-5.1-Thinking-highがついにARC-AGI-2でGrok-4を破る https://t.co/ItC5UwuW1r
TestingCatalog News 🗞: (翻訳) OpenAIのGPT-5.1 Thinking HighがARC AGI 2ベンチマークでトップの座を獲得し、Grok 4を王座から引きずり下ろしました。\n\nGPT-5.1は過小評価されていましたか?👀 https://t.co/pCkAwJ2NDS
Gemini 3の噂が錯綜、性能低下の懸念も【続報】
- Googleの次期モデル「Gemini 3」に関する続報です。
- AI StudioのUIからリリースを示唆するヒントが見つかり期待が高まる一方、開発中のモデルの性能が低下しているのではないかという懸念の声も上がっています。
- 主要ベンチマークで競合モデルを上回れるか、錯綜する情報の真偽に注目が集まっています。
leo 🐾: (翻訳) ほぼ毎日、Gemini 3への期待を下げるようなことを見聞きします。\n\n今日もまたそうで、正直もうこのローンチにはあまり興奮していません。モデルは新しいチェックポイントごとに退化しています。DeepMindは期待を管理すべきです。それなのに私たちは
Lisan al Gaib: (翻訳) aistudioにGemini 3のヒント\n\n「このモデルで最もパフォーマンスの高い値に温度が設定されています」→「Gemini 3の場合、デフォルトの1.0で最良の結果が得られます。値を低くすると推論に影響する可能性があります。」 https://t.co/pTN7NfP69l
Haider.: (翻訳) Gemini 3が打ち負かさなければならない主なモデルはGPT-5 proとGPT-5/5.1です。\n\n以下は、一般的なLLMの現在のSOTAベンチマーク結果です。\n\n- GPQA: 88%\n- HLE: 31.6% (ツールなし)\n- ARC-AGI 1: 70%\n- ARC-AGI 2: 18%\n- SWE-Bench: 77%\n\nGemini 3がこれらのすべ...
Jeff Bezos氏、新AI企業PrometheusでCEO復帰
- Amazon創業者のJeff Bezos氏が、新たに設立したAIスタートアップ「Project Prometheus」の共同CEOとして現場に復帰すると報じられました。
- 同社は62億ドルの資金を元に、宇宙、自動車、コンピュータなどのエンジニアリングや製造業向けのAI開発を目指します。
- 巨大テック企業の創業者が再びAI分野の最前線に立つ動きとして、大きな注目を集めています。
Forbes: (翻訳) ジェフ・ベゾス氏、共同で率いる62億ドルのAIスタートアップを立ち上げ、報告書が伝える https://t.co/EirsMaGaPO https://t.co/CgdcJisIUO
TechCrunch: (翻訳) ジェフ・ベゾスが新しいAIスタートアップ、プロジェクト・プロメテウスの共同CEOとして現場復帰したと報じられている https://t.co/ca5WwGXP5S
Rohan Paul: (翻訳) ニュース🏭:ジェフ・ベゾスが再びCEOのバッジを正式に着用。\n\nベゾスは62億ドルでプロジェクト・プロメテウスを立ち上げ、宇宙、自動車、コンピューターにまたがるエンジニアリングと製造のためのAIを構築する共同最高経営責任者を務めています。\n\nプロメテウスは、部品を設計し、計画するAIに関するものです https://t.co/JNcwA8mhQZ
Cloudflare、AIモデル実行プラットフォームReplicateを買収
- CDN大手のCloudflareが、AIモデルの実行プラットフォームを提供するReplicateの買収を発表しました。
- Replicateは、様々なオープンソースのAIモデルをAPI経由で簡単に利用できるサービスとして、多くの開発者に支持されています。
- 今後はCloudflareのグローバルなインフラを活用し、より高速で安定したサービスを提供できるようになるとしており、AI開発のインフラ環境がさらに強化されることが期待されます。
Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭: 🫨
石川陽太 Yota Ishikawa: CloudflareがAI APIプラットフォームReplicateを買収!!これは激アツ案件
Google、研究アイデアを自動生成するマルチエージェントシステム開発中
- Googleが、複数のAIエージェントを連携させて研究アイデアを自動で生成・評価するマルチエージェントシステムを開発していることが明らかになりました。
- Gemini Enterprise向けに「Idea Generation」と「Co-Scientist」という2つのエージェントが開発されています。
- トーナメント形式でアイデアを評価・洗練させる仕組みを持ち、約40分で100以上の詳細なアイデアを生み出すことができるとされ、科学研究の自動化に向けた大きな一歩として注目されます。
Chubby♨️: (翻訳) なんてこった!Googleは、Gemini Enterprise向けの新しい「アイデア生成」および「共同科学者」エージェントを含む、約40分で100以上の研究アイデアを生成し、トーナメントランク付けできる強力なマルチエージェントシステムを構築しています。\n\nこれは、自動化された製品化された科学への移行を示しています https://t.co/vpAyHjYELP
Google DeepMind、高精度な気象予測AI「WeatherNext 2」発表
- Google DeepMindが、従来モデルより高速かつ高精度な全球気象予測を可能にする新しいAIモデル「WeatherNext 2」を発表しました。
- 新しいネットワークアーキテクチャ「Functional Generative Network」を採用し、1分以内に数百通りの確率的予測結果を生成できるとされています。
- エネルギー取引や災害予測など、様々な分野での活用が期待されています。
Bloomberg: (翻訳) Google DeepMindの新しいAI気象モデルは、これまでに構築されたどのモデルよりも高速かつ正確で、エネルギートレーダーにソリューションを提供します @jwertz https://t.co/VUDAxwlTCC
Chubby♨️: (翻訳) これは素晴らしいアップデートです。WeatherNext 2は、1分以内に何百もの可能な結果を生成できる新しいFunctional Generative Networkを使用することで、全球気象予報を大幅に高速化および改善します。\n\n以前のバージョンよりも8倍高速で正確です。
GoogleのAI Studio、来年初めにモバイルアプリ提供へ
- GoogleのAIモデル開発プラットフォーム「AI Studio」の専用モバイルアプリが、来年初めにリリースされる予定であることが明らかになりました。
- これにより、外出先からでも手軽にAIモデルのコードを編集したり、実行したりできるようになることが期待されます。
- 開発環境のモバイル対応は、AI開発の裾野をさらに広げる可能性があります。
TestingCatalog News 🗞: (翻訳) AI Studioは来年初めに専用のモバイルアプリをリリースする予定です。\n\nApp Storeで簡単にトップ1になれるでしょうか?👀 https://t.co/Zlkwlvp6Yt
Kol Tregaskes: (翻訳) Google AI Studioモバイルアプリは「来年初め」に登場予定。|\n\n@julesagentのモバイルアプリはもうありますか?\n\nAndroidアプリの構築に役立ちそうです。https://t.co/G5pbroAyEF
Chubby♨️: (翻訳) Googleは与え続ける
Kaggle、恒例のサンタ最適化コンペを開始
- Kaggleで毎年恒例となっているサンタクロースをテーマにした最適化コンペ「Santa 2025」が開始されました。
- 今回はクリスマスツリーのパッキングがテーマとなっており、世界中のKagglerが腕を競います。
- 年末年始の風物詩ともいえるコンペの開催に、コミュニティが盛り上がりを見せています。
Kagoole: (翻訳) 新しい#kaggleコンペティション「Santa 2025 - Christmas Tree Packing Challenge」が開始されました。\n\nメダル:あり\nカーネルのみ:なし\n締め切り:2026-01-30 23:59:00+00:00\nhttps://t.co/Ika0Xrup9P
ざぶろう: Santa 2025 来てるじゃん https://t.co/8XP8mi8oyU