2025年12月22日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

AIコーディング能力の急速進化と国産AI開発の新展開

AIのコーディング能力が4ヶ月で2倍になるペースで成長し、「知能爆発」の可能性も指摘されています。

国内では官民連携で1兆パラメータ規模の国産AI開発を目指す新会社設立が報じられました。また、ロボット分野では人間の動画から学習する基盤モデルが進化を遂げています。

では、各トピックの詳細をご覧ください。

目次

  1. AI向け半導体メモリ価格高騰、2027年まで続く見通し【続報】
  2. AIのコーディング能力 4ヶ月で2倍に 指数関数的成長が加速【続報】
  3. 官民連携で1兆パラメータ国産AI開発へ、新会社設立報道
  4. Disneyなど、人間の動画から学ぶロボット基盤モデル発表
  5. GPT-5.2 Codex、3時間超のタスク実行術が公開
  6. Gemini 3 Flash、新ベンチマークでGPT-5.1-highに匹敵【続報】
  7. Claude Code続報、/skillsコマンドで能力一覧が可能に
  8. atmaCup#22が閉幕、参加者が解法や感想を共有
  9. xAI、GrokのWeb版からモデル選択メニューを削除か

AI向け半導体メモリ価格高騰、2027年まで続く見通し【続報】

  • AI開発の活況を背景とした半導体メモリ価格高騰の続報です。
  • AIの学習に不可欠なHBMやDRAMの供給が追いつかず、この価格上昇は2027年まで続くとの新たな見方が示されました。
  • この影響はPCパーツにも及んでおり、自作PC市場への影響も懸念されています。
パウロ: Xiaomi CEO 2027年までメモリ価格は上昇 大規模に買える会社は遠くが見えますよね 長期契約できるかな

Jukan: (翻訳) Xiaomi CEO:メモリ価格は2027年まで上昇する見込み。Xiaomi 17 Ultraの価格に関するコメントは、価格が明確に上昇し、その幅もかなり大きくなることを示唆しています。 •雷軍氏は、2022年後半からAIが爆発的に成長しており、総合的に判断すると2025年、2026年、そして

パウロ: やべぇ どこまでメモリ上がるんだ メモリ半導体、利益でTSMCを抜く

AIのコーディング能力 4ヶ月で2倍に 指数関数的成長が加速【続報】

  • AIエージェントが自律的にコーディングタスクを遂行できる時間が、指数関数的に増加しているとお伝えしましたが、そのペースがさらに加速しています。
  • METRの最新ベンチマークによると、タスク遂行可能時間は約4ヶ月で2倍になるペースにまで加速しており、これは以前報告されていた「7ヶ月ごと」から大幅な短縮です。
  • この状況を受け、Anthropicの研究者からは、AI自身がAI研究を行う「自動AI研究」が間もなく実現し、「知能爆発」につながるとの予測も出ています。
Chubby♨️: (翻訳) AIエージェントが実行できる(コーディング)タスクの長さは、指数関数的に増加しているだけでなく、さらに加速しています! 2019–2024年:タスク期間は7ヶ月ごとに2倍に 2024–2025年:タスク期間は4ヶ月ごとに2倍に 多くの人々は、この開発がまだ把握できていません。

Chubby♨️: (翻訳) Anthropic:「自動化されたAI研究と知能爆発は間近」 なんてことだ、Anthropicは知能爆発を確信しているため、アライメントに注力している。壁などなく、我々はまだ始まったばかりだ!

Haider.: (翻訳) opus 4.5による最新のMETRの結果以来、我々はほぼ垂直的な進歩の時代に突入しました。このようなジャンプがもう数回あれば、ソフトウェアオンデマンドやRSIに向かう可能性があります。進歩はMETRの以前の7ヶ月の倍増期間に匹敵するだけでなく、それを上回っています。

官民連携で1兆パラメータ国産AI開発へ、新会社設立報道

  • ソフトバンクなどが出資し、官民で国産AIを開発する新会社が設立されると報じられています。
  • 世界トップレベルを目指し、現在の潮流である「1兆パラメータ」規模のモデル開発を目標に掲げています。
  • 計算資源やデータの質・量がモデル性能を左右する中で、日本のAI開発におけるプレゼンス確立に向けた大きな一歩として注目されます。
カレーちゃん: 官民で国産AI開発、ソフトバンクなど出資で新会社…世界潮流の「1兆パラメーター」目指す #ldnews https://t.co/HUsXPxtfqp

星ちゃん: 官民で国産AI開発、ソフトバンクなど出資で新会社…世界潮流の「1兆パラメーター」目指す : 読売新聞オンライン https://t.co/WwVn177pdv

パウロ: 計算資源とデータの質と量が生成AIモデルの性能を決めるスケーリング則が生きていることが辛いですね 50万基Nvidia GPUとデータの整備が急務です

Disneyなど、人間の動画から学ぶロボット基盤モデル発表

  • ロボット開発において、人間の動画から知識を転移できる「ロボット基盤モデル」の進化が注目されています。
  • Disney Researchが公開したオラフのロボットは、キャラクターの表現を報酬として強化学習を用いることで、自然な動きを実現しています。
  • また、kyber labsのロボットが繊細な手作業をこなすデモも公開され、ブルーカラーの仕事がAIに代替される可能性が示唆されています。
Yuki Nanri | Algomatic Robotics CEO: ロボット基盤モデルができつつある。 事前学習モデルの大規模化で、人間の動画から知識の転移能力が創発する。 データ販売事業を一時検討したけど、技術が想像以上に早すぎて、ここではない感がある。 https://t.co/0N5srTPXky

Chubby♨️: (翻訳) あなたのブルーカラーの仕事も安泰ではありません。kyber labsのロボットがどれほど繊細に手作業を行うか、よく見てください。これは驚きです。

Yuki Nanri | Algomatic Robotics CEO: めちゃくちゃ面白い。 ディズニーの世界観を崩さないために、機能的な部分より表現を報酬に。 キャラクター独自の挙動と物理的な動きのなめらかさを強化学習。 AI Toyの最高峰。

GPT-5.2 Codex、3時間超のタスク実行術が公開

  • OpenAIのGreg Brockman氏が、GPT-5.2 Codexで3時間といった長時間タスクを実行させるプロンプトのコツを公開しました。
  • エージェントにタスクの連続性を保つための具体的な指示を与えることで、一貫性を保ったままタスクを完了させることが可能になるとのことです。
  • 一方で、同モデルは創造性が高いものの説明が簡潔すぎるとの指摘もあり、Opusと使い分けるなど様々なワークフローが模索されています。
Greg Brockman: (翻訳) GPT-5.2 Codexに長時間タスクを指示する方法:

Kenn Ejima: GPT-5.2-Codexの動作が速くなったので 1. Opusでプラン 2. Codexでプランをレビュー 3. Opusの新スレッドでプランを実行 4. Codexで実行結果のレビュー の順番と役割が揺れている… プランの可読性でいうと Opusのほうが人間にやさしい けどどうせほとんど読んでないし

Haider.: (翻訳) gpt-5.2 codexは時々本当に創造的ですが、通常はあまりにも簡潔です。あまり説明しないので、実装を事前に計画したり、構築中に物事を明確にしたりするのが難しい場合があります。フォローアップの質問を続けるよりも、最初に詳細な回答を得たいです。

Gemini 3 Flash、新ベンチマークでGPT-5.1-highに匹敵【続報】

  • Googleの「Gemini 3 Flash」に関する続報です。
  • コストパフォーマンスを測る新ベンチマーク「WeirdML」にて、GPT-5.1-highに匹敵するスコアを記録し、再び注目を集めています。
  • 特にコード実行時間が優れている点が高く評価されています。
Lisan al Gaib: (翻訳) Gemini 3 FlashはWeirdMLで非常に良い成績を収めており、GPT-5.1-highと同等のレベルに位置しています。

Kimihiko Kitase ♨️ 北瀬 公彦: Antigravity の Computer Use が、Gemini 3 Flash ベースになってるだと!

Haider.: (翻訳) gemini 3の性能向上は、主に事前学習の規模とモデルサイズの拡大によるものと思われます。一方、gpt-5.2はRLのスケーリングによるものが大きいでしょう。gemini 3 flashがはるかに小さいにもかかわらずgemini 3 proに近い性能を発揮するため、人々はこの点を疑問視しました。その小さな差は、flashが恩恵を受けたことを示唆しています。

Claude Code続報、/skillsコマンドで能力一覧が可能に

  • AnthropicのAI開発アシスタント「Claude Code」の続報です。
  • 新たに追加された「/skills」コマンドにより、現在AIが認識しているSkillsの一覧と、それぞれのトークン数が表示されるようになりました。
  • エージェントが持つ能力をユーザーが簡単に把握・管理できるようになり、開発の透明性が向上します。
Oikon: Claude Code に /skills コマンドが入ってた。認識されているSkillsと、ロードされた時のそれぞれのSkillsの使用トークン数が一覧で表示される。 https://t.co/ApVLPUCuKX

Iaiso: Claude Codeの送信プロンプトを監視している人がスラッシュコマンドがSkillsにマージされようとしてるのを発見したようだ。確かに claude "Skillツールとはなんですか?" で起動すると教えてくれる。

atmaCup#22が閉幕、参加者が解法や感想を共有

  • Kaggleコミュニティで人気のコンペ「atmaCup」の第22回が終了し、参加者から多くの反響が寄せられています。
  • 今回はサッカーの試合における選手の動きをトラッキングする物体検出タスクで、参加者は様々な解法を試し、知見を共有しました。
  • 上位入賞者の解法も公開されており、疑似ラベル付けのループや後処理なしで画像モデルの性能を最大限に引き出すアプローチなどが注目されています。
Jack: 4位で入賞逃して悔しいですが、色々と勉強になりました。解法書きました。 https://t.co/yJEGzs6izC #atmacup

YujiAriyasu: atmacup 1st stageでiou > 0.5か否かを予測 2nd stageは普通に距離学習 でした。 2nd stageで予測->疑似ラベル付け->疑似ラベル加えて2nd stage再学習、のループを20回以上まわしただけです。後処理なし!画像モデルの力だけで戦うのがテーマだったので最終提出にはlabel_id:8も混ざってたりしました。

fufufukakaka: atmacup は6位でした!鬼のようなアノテーションをしました。この土日に時間をあまり用意できなかったな〜 https://t.co/vOmE4GnUCU

xAI、GrokのWeb版からモデル選択メニューを削除か

  • xAIが提供するGrokのWeb版から、モデルを選択するメニューが削除されたことが報告されています。
  • この変更が何を意味するのか、ユーザーの間で様々な憶測を呼んでいます。
  • 一方で、まだWebサイトやアプリにはGrok 4.1 Fastモデルがリリースされておらず、ユーザーからは早期の提供を望む声が上がっています。
Tech Dev Notes: (翻訳) xAIがGrok Webからモデルメニューを削除 これは何を意味するのか...

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください