2025年12月28日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
NVIDIAとGroqの200億ドル提携、コーディングAIの進化
NVIDIAとGroqの提携が200億ドル規模のライセンス契約と判明。推論処理の最適化戦略として注目を集めています。
一方、Claude Opus 4.5は「IDE不要」との報告が話題に。GPT-5.2 Codexも高評価を得ていますが、トンネルビジョンの課題も指摘されています。
また、AIエージェントが自己対戦でバグ修正を学習する手法や、Kaggleの上位解法サマリー機能など、開発環境の進化も続いています。
では、各ニュースの詳細をご覧ください。
目次
- NVIDIAとGroqの提携、200億ドルのライセンス契約と判明【続報】
- 続報: Claude 4.5、「IDE不要」の開発スタイルで高評価
- Gemini、利用者増もUI/UXと安定性に課題【続報】
- AIエージェントが自己対戦で進化、バグ注入と修正を繰り返し学習
- GPT-5.2 Codex続報、高評価の一方で「トンネルビジョン」の課題も
- Kaggleに新機能、上位解法のサマリーが閲覧可能に
- 退役した米海軍の原子炉をAIデータセンターに再利用する提案
- vLLMでMLXバックエンドの開発が進行中、Apple Siliconでの推論が高速化か
- 日本の宇宙ロボット、月面基地建設に向けた自律組み立てに成功
NVIDIAとGroqの提携、200億ドルのライセンス契約と判明【続報】
- 先日報じられたNVIDIAとGroqの提携について、詳細が明らかになりました。
- 契約は200億ドル規模の非独占的ライセンス契約で、推論処理を「Prefill」と「Decode」に分け、それぞれを最適化する戦略の一環です。
- 特に応答生成にあたる「Decode」処理では、GroqのSRAMベースのアーキテクチャが高い性能を発揮すると期待されています。
- アナリストは、この動きをNVIDIAが訓練市場だけでなく推論市場でも主導権を維持するための戦略的な一手だと分析しています。
Rohan Paul: (翻訳) Nvidiaの200億ドルのGroqライセンス契約に関する以下のGavinの投稿は非常に洞察に満ちています。 AI推論にはPrefillとDecodeの2つのステップがあります。 Prefillは、モデルがプロンプトとコンテキスト全体を読むことを意味します。 Decodeは、一度に小さなテキストの塊を書き込むことを意味します。 これら2つのステップは異なるものを好みます https:/...
Rohan Paul: (翻訳) バンク・オブ・アメリカの調査によると、今後Nvidiaは推論を単なる「GPUの付属機能」ではなく、独立した一流の製品ラインとして扱う準備を進めているとのことです。Nvidiaはすでにトレーニングスタックで勝利を収めており、今度は推論スタックも「Nvidiaの形」を維持したいと考えています。たとえそれが… https://t.co/jxdDsc7zL2
Jukan: (翻訳) 私もそう思います。NVIDIAはGroqの技術を、デコード用に開発しているRubin CDXと組み合わせるのではないでしょうか?私はそう考えています。
続報: Claude 4.5、「IDE不要」の開発スタイルで高評価
- AnthropicのClaude Opus 4.5に関する続報です。あるエンジニアから「この1ヶ月、IDEを全く開かずにOpus 4.5が200のプルリクエストを作成した」との報告があり、AIに指示を出す開発スタイルへの変化を示唆しています。
- 一方で、以前のバージョンに比べて幻覚(ハルシネーション)が増えたとの指摘もあり、モデルの挙動の変化が議論されています。
- それでもなお、ソフトウェアエンジニアリングのツールとしてGPT-5.2より優れているという意見も見られます。
Haider.: (翻訳) Anthropicのエンジニア:「この1ヶ月はエンジニアとして初めてIDEを全く開かなかった月で、opus 4.5が約200件のPRを一行残らず書いてくれた」 来年何が起こるか、もうお分かりでしょう。ますます多くの開発者が作業を指示する側になり、作業そのものではなくなっています。 https://t.co/yVhk3uh30O
elvis: (翻訳) 「ますます、コードはもはやボトルネックではなくなっています。」 Claude Codeがまさに転換点であったと私は確信しています。 それはプログラマーが今まで見たことのないようなプリミティブです。 コーディング以上をこなせるインテリジェントなオーケストレーターです。 そして、まだ始まったばかりです。
Haider.: (翻訳) opus 4.5は以前は素晴らしかったのですが、どういうわけか最近は幻覚を見ることが多くなりました。それでも全体的に見れば、より優れた「ソフトウェアエンジニア」だと思います。しかし、gpt-5.2の方が明らかに賢いです。複雑な問題を処理し、より多くの点と点を結びつけることができます。たとえそこにたどり着くのにもう少し時間がかかったとしてもです。
Gemini、利用者増もUI/UXと安定性に課題【続報】
- Similarwebの調査によると、GoogleのGeminiのウェブトラフィック市場シェアが過去1ヶ月で13.7%から18.2%へと大幅に増加し、ユーザー数の拡大が続いています。
- 一方で、モデルの性能は評価されつつも、アプリやインターフェースが「苦痛なほど使いにくい」との声が上がっており、UI/UXが課題とされています。
- また、応答がループしたり、以前の質問に再度答え始めたりするなど、信頼性の問題も指摘されており、安定性の向上が求められています。
Rohan Paul: (翻訳) Geminiのウェブトラフィックが急増しています。市場シェアは1ヶ月で13.7%から18.2%に急上昇しました。Gemini 3は明らかに機能しており、Gemini 3 Flashはまだ準備運動中です。そして、そのシェアは12ヶ月で5.4%から18.2%に増加しました。これは小さな動きではなく、明確な支配の変化です。https://t.co/hGfzgmqQwA
Haider.: (翻訳) Googleはとんでもなく最高のモデルを持っていますが、そのアプリやインターフェースは本当に使いにくいです。ChatGPTにはAppleのような雰囲気があります。スペックが常に最高というわけではなくても、ただ機能し、体験はスムーズで洗練されています。
Lisan al Gaib: (翻訳) Gemini 3 Proは賢いですが、信頼性がありません。推論を示したり、繰り返しのドゥームループに陥ったりすることが何度も起こっています。
AIエージェントが自己対戦で進化、バグ注入と修正を繰り返し学習
- ソフトウェア開発エージェントが、人間の書いたコードなしで自己改善する強化学習手法「Self-play SWE-RL (SSR)」が発表されました。
- この手法では、単一のLLMエージェントが、実際のコードリポジトリをベースに「バグの注入」と「バグの修正」を自己対戦形式で繰り返すことで学習します。
- 人間が作成した課題やテストケースを必要とせず、自律的に能力を向上させることができるため、AIエージェント開発の新たな方向性として注目されています。
Junyang Lin: (翻訳) ソフトウェアエージェントは自己対戦強化学習によって自己改善できる 自己対戦SWE-RL(SSR)の紹介:単一のLLMエージェントを、人間がラベル付けした問題やテストなしで、現実世界のリポジトリに基づいてバグ注入とバグ修正の間で自己対戦するようにトレーニングする。 🧵 https://t.co/cAf0gK5vx6
ymicky: Self-playでSWEエージェントを強化学習。Issue/手順なしでDocker化リポだけを与え、同一モデルが「バグ注入↔修正」を回して学習。SWE-bench Verified 41→51%、Pro 21→29%へ改善。 Agent0みたいな人間のデータゼロで学習する手法増えてきたな
GPT-5.2 Codex続報、高評価の一方で「トンネルビジョン」の課題も
- 先日公開されたOpenAIのコーディングモデル「GPT-5.2 Codex」の続報です。
- 共同創業者Greg Brockman氏が順調な進捗を示唆しており、ユーザーからは動作の明確さ、ファイル編集の一貫性、タスク効率の向上を評価する声が上がっています。
- 一方で、特定のタスクに集中しすぎる「トンネルビジョン」に陥るという指摘もあります。
- システム全体の設計のような、より広い視野が求められるタスクには、GPT-5.2 High/XHighの方が適しているとの意見も出ています。
Greg Brockman: (翻訳) gpt-5.2 codexの進捗、まもなくさらに急速な改善が見られます
Haider.: (翻訳) codexは集中したタスクに非常にうまく機能します。トークンが少なく、実行が速く、狭い範囲で鋭さを保ちます。しかし、gpt-5.2 highまたはxhighは、codexと同じトンネルビジョンに悩まされないため、アーキテクチャや全体像のシステム作業に適しています。それらを一緒に使用します。
Greg Brockman: (翻訳) バックグラウンドで仕事が進んでいる間に家族と過ごすためのCodex:
Kaggleに新機能、上位解法のサマリーが閲覧可能に
- Kaggleのコンペティションページに、上位入賞者の解法をまとめた「Solution Summaries」機能が新たに追加されたことが報告されました。
- これにより、各コンペでどのようなアプローチが成功したのかを、簡潔に把握できるようになります。
- 将来的には、サマリーだけでなく、上位解法を再現・実行可能な形で共有する機能の実装も目指しているとのことです。
かまろ/Camaro: New feature: solution summaries! You can now view a concise summary of winning solutions for each Kaggle competition. Here’s the summary for the recently finished MABe Mouse Behavior Detection competi...
かまろ/Camaro: 次はwinning solutionを再現実装して、それを実行可能にして共有できるようにするので待っていて欲しい。
かまろ/Camaro: Kaggleのコンペ解法サイト、もし収益化しようとするとKaggleの共有資産を売ることになるか、private sharingになるかしかなさそうで、初めから詰んでいるプロダクトかもしれない?
退役した米海軍の原子炉をAIデータセンターに再利用する提案
- 増大するAIデータセンターの電力需要に対応するため、米海軍の退役した原子力潜水艦の原子炉を再利用する提案がなされています。
- テキサス州の開発者が、エネルギー省の融資保証を利用して、退役原子炉2基を陸上に移設し、AIデータセンターキャンパスの電力源として活用する計画です。
- この計画は、安定したクリーンエネルギーをデータセンターに供給する新たな方法として注目されています。
Rohan Paul: (翻訳) 🇺🇸 退役した米海軍の原子炉をAIデータセンターの電力源として再利用する提案。テキサス州の開発者は、米国エネルギー省(DOE)の融資保証を利用して、退役した米海軍の原子炉2基を陸上に移設し、安定した原子力でAIデータセンターキャンパスを運営したいと考えている。https://t.co/rvSC5Xb3Xy
vLLMでMLXバックエンドの開発が進行中、Apple Siliconでの推論が高速化か
- AppleのMLXフレームワークをvLLMのバックエンドとして利用する開発が進められていることが明らかになりました。
- vLLMは、LLMの推論を高速化・効率化するためのライブラリとして広く使われています。
- MLXバックエンドが統合されることで、Apple Silicon上でのLLM推論がさらに最適化され、MacデバイスでのローカルAIアプリケーション開発が加速することが期待されます。
Awni Hannun: (翻訳) vLLM用のMLXバックエンドが開発中であることにかなり興奮しています:https://t.co/oyLAkS0vId
日本の宇宙ロボット、月面基地建設に向けた自律組み立てに成功
- 日本の宇宙スタートアップGITAIが開発したロボットが、月や火星の基地建設を想定した5mのタワーを自律的に組み立てるデモを公開しました。
- このロボットシステムは、平坦でない地面にも対応できるため、整地されていない場所でも太陽光パネルの設置などが可能になるとしています。
- 宇宙空間での建設作業を自動化する技術として、今後の展開が期待されます。
Rohan Paul: (翻訳) 日本では、GITAIのロボットが活躍しています。将来の月や火星の居住区のために、自律的に5メートルのタワーを組み立てています!すごいのは、これらのシステムは平らでない地面にも対応できるので、平らな土地は必要ないということです。これは、平らでない場所で太陽光発電を拡大する上で大きな意味を持ちます。https://t.co/LYYnRjTMcU