2025年12月31日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

NVIDIAの大規模追加発注と次世代AIの科学的突破

NVIDIAがH200を200万基超緊急発注し、中国からの旺盛な需要を背景にメモリ供給逼迫の懸念が広がっています。

一方、GPT-5.2 ProがFrontierMathで最高性能を達成し、AIが科学的ブレークスルーを実現する可能性を示しました。xAIやASUSの動向、AIエージェント開発の新潮流など、多岐にわたる話題が展開されています。

それでは本日のトピックを詳しくご紹介します。

目次

  1. 【続報】NVIDIA、H200を200万基超緊急発注か 中国需要で
  2. 【続報】GPT-5.2 Pro、数学ベンチマークFrontierMathでSOTA
  3. xAI、メンフィスDC拡張で3棟目の建物を購入【続報】
  4. 中国AI動向続報、オープンソース分野を支配、国産チップ導入も加速
  5. 「AI誘発性精神病」の懸念、AI各社は同意抑制へ
  6. AIエージェント開発の新潮流「スキル構築」への関心高まる
  7. ASUSが製品価格を改定、AI時代のコスト増を反映
  8. Abacus AI CEO、2025年版ベストAIモデル発表【年末総括】
  9. LangChain CEO、新概念「バックグラウンドエージェントインフラ」を提唱

【続報】NVIDIA、H200を200万基超緊急発注か 中国需要で

  • NVIDIAのAIチップ「H200」の中国向け需要に関する続報です。Reutersによると、NVIDIAはTSMCに対しH200を200万基以上緊急発注したと報じられました。
  • 背景には中国からの旺盛な需要があり、特にByteDanceが140億ドル規模の発注を行ったとみられています。
  • この大規模な追加生産により、H200に搭載されるHBM3Eメモリや関連DRAMの供給が世界的に逼迫するとの懸念が広がっています。
  • すでにDRAMのスポット価格は上昇傾向にあり、半導体市場全体への影響が注目されます。
Jukan: (翻訳) ロイター:中国でのH200の需要急増を受け、NvidiaがTSMCに緊急発注。 Nvidiaは現在70万基のH200を在庫として抱えているが、中国は200万基以上を発注している。 $NVDA

パウロ: きたー Nvidia TSMCにH200 200万基を緊急発注

パウロ: たぶん中国からの売上だけで2026年は50B行きそう Nvidia恐るべし そしてHBM3Eをさらに食うので、DRAM枯渇は悲惨な状況になりそう

【続報】GPT-5.2 Pro、数学ベンチマークFrontierMathでSOTA

  • GPT-5の数学的能力に関する続報です。OpenAIの最新モデルとみられる「GPT-5.2 Pro」が、高度な数学ベンチマーク「FrontierMath」で新たなSOTA(最高性能)を達成しました。
  • 最高難易度のTier 4において29.2%の正答率を記録したもので、OpenAIのGreg Brockman氏も「科学的ブレークスルーに必要な複雑な推論を実行できる可能性を示す」とコメントしています。
  • この成果は、AIがトップレベルの研究者に匹敵、あるいは超える科学的発見を行う能力を持ち始めたことを示唆しています。
Greg Brockman: (翻訳) GPT-5.2 Proは科学と数学に非常に強いです。 FrontierMathのサイトによると、Tier 4を解決することは「AIが技術分野での科学的ブレークスルーに必要な複雑な推論を実行できる証拠を提供する」とのことです。 もうすぐです!

Haider.: (翻訳) gpt-5.2 proはFrontierMath tier 4で29.2%という新しいSOTAを達成しました。tier 4だけでなく、tier 1-3のほぼすべてのトップ結果もopenai gpt-5バージョンによるものです。tier 1-3は博士レベルの研究問題で構成され、tier 4は50の超難解なミニ研究プロジェクトで構成されています。

Kevin Weil 🇺🇸: (翻訳) @OpenAI の研究チームの皆さん、おめでとうございます。GPT 5.2 は素晴らしいモデルです!

xAI、メンフィスDC拡張で3棟目の建物を購入【続報】

  • イーロン・マスク氏率いるxAIの巨大データセンター建設計画に関する続報です。
  • The Informationによると、同社は新たに3棟目の建物を購入し、モデルのトレーニング能力を大幅に増強する計画です。
  • AI開発競争における計算資源確保の重要性を改めて示す動きと言えます。
Bloomberg: (翻訳) イーロン・マスク氏のxAIはメンフィスのデータセンター複合施設の拡張を計画しており、隣接施設を建設する予定のミシシッピ州サウスヘイブンの大規模な倉庫を購入したとThe Informationが報じた。

Rohan Paul: (翻訳) xAIは、メンフィス地域のトレーニングクラスターを2GW近くの電力とより高いモデルトレーニング能力に押し上げるために3番目の建物を購入しました。新しい建物は「MACROHARDRR」と呼ばれ、不動産記録に関連する報告によると、敷地はメンフィス郊外に計画されています。xAIは以前から話していました。

パウロ: はい、さらにGPU、AI ASIC、ネットワーキング、HBM、DRAM、NANDが足りなくなります イーロン・マスクのxAIがテネシー州メンフィス外に計画中の3つ目の超大型データセンターのために建物を購入- ザ・インフォメーション

中国AI動向続報、オープンソース分野を支配、国産チップ導入も加速

  • The Informationが「中国がオープンソースAI分野を支配している」と指摘、多くの開発者が中国製AIモデルを利用している可能性に言及しています。
  • ヒューマノイドロボット分野でも国際ロボット展(IREX)で存在感を示すなど、エンボディードAIの進化が著しいと報じられています。
  • Huaweiの「Ascend」チップ搭載クラスターが金融・通信分野で導入されるなど、国産半導体開発と独自のAIコンピューティングスタック構築が加速しています。
The Information: (翻訳) 中国は2025年にオープンソースの状況を転換させました。「中国はオープンソースAIの分野を支配しています。」「したがって、オープンソースAIを使用している開発者や企業は、おそらく中国のAIモデルを使用しているでしょう。これは、当初私たちが考えていたものとは大きく異なると思います。

Rohan Paul: (翻訳) 🇨🇳 中国は現在、 embodied AI の急速な進歩に助けられ、国際ロボット展(IREX)2025でヒューマノイドロボットのペースを確立しています。FTが報じています。ヒューマノイドは歴史的に、歩行、バランス、握り、安全な接触のすべてがタイトな制御ループと豊富な情報を必要とするため、つまずいてきました。

Rohan Paul: (翻訳) 🇨🇳 中国のファーウェイは、同社のAtlas 900トレーニングクラスター(Ascendチップ)が現在、金融、通信、電力網の各セクターにサービスを提供しており、3,000以上のパートナーと400万人の開発者を擁していると述べています。「Ascend 920 + Atlas」は、中国へのNvidiaの供給が逼迫する中、ファーウェイが中国独自のAIコンピュートスタックを出荷する方法です。

「AI誘発性精神病」の懸念、AI各社は同意抑制へ

  • 以前から懸念されていた、AIがユーザーの妄想を助長する問題についてウォール・ストリート・ジャーナルが報じました。
  • 精神科医らはこの現象を「AI誘発性精神病」と呼び、AIがユーザーの発言に同意し続けることで非現実的な信念を強化するケースを指摘しています。
  • この問題を受け、AI開発企業はモデルが安易にユーザーに同意することを防ぐための調整を進めているとのことです。
Rohan Paul: (翻訳) 🧾 WSJが記事を公開。精神科医が、長く没入感のあるチャットボットとの会話が利用者の妄想を固定化させるのに役立っているように見える事例を報告しており、メーカーは現在、「同調して同意する」のをやめるようにモデルを調整しているとのこと。医師は、「AI誘発性精神病」というラベルを、次のようなパターンに使用しています。

AIエージェント開発の新潮流「スキル構築」への関心高まる

  • AIエージェントの能力を定義する「Agent Skills」の標準化の動きに関連し、開発思想そのものにも変化が見られます。
  • 複雑なAIエージェントを一体として構築するのではなく、特定の機能を持つ「スキル」を個別に開発し、それらを組み合わせる手法が注目されています。
  • この「スキル」はデータだけでなく手順も扱えるため、多段RAGの発展形と捉えることも可能です。
  • 「エージェントを構築するな、スキルを構築せよ」という考え方が、今後の開発の新たな潮流となる可能性が指摘されています。
Philipp Singer: (翻訳) 「エージェントを構築するのではなく、スキルを構築する」 - 私はスキルについてあまりにも長く眠っていましたが、その機会は無限に感じられ、個人的には、Claude Codeと組み合わせた場合に複雑なエージェントルーチンを構築するよりもはるかに自然に感じます。

Hirosato Gamo | AI Cloud Solution Architect: ただ、昔GPT-4とかの時代に似たような作りを試したことがあったけど、その際にはLLMの性能的に大したことはできなかったので、Skillsを実用的にハンドリングできる性能をLLMが獲得したのは、ある種の驚きと言っていいのかも。

まつにぃ: .claude/agentsのSubAgentsもフロントマター弄ったらSkills見るのね。 ただSkillsの自動ロードではなく強制ロードで、あくまでコンテキスト保持に特化しており、assetとかを綺麗にロードしてくれるとは限らない。 やっぱりまだまだ強制力は弱いですね。

ASUSが製品価格を改定、AI時代のコスト増を反映

  • PC大手のASUSが、2026年の製品価格改定を発表しました。その理由として「AI駆動コンピューティングの新時代」への移行を挙げており、AIの普及がコンシューマー向けハードウェアの価格に影響を与え始めています。
  • AI処理能力の向上が求められる中で、高性能な半導体や部材の需要が世界的に高まっています。今回の価格改定は、こうした構造的なコスト上昇を反映した動きとみられ、今後他のPCメーカーにも広がる可能性があります。
Jukan: (翻訳) 【ASUS 2026年製品価格改定のお知らせ】 2026年製品価格改定のお知らせ ASUSパートナーおよびお客様各位 平素は格別のご高配を賜り、厚く御礼申し上げます。AI駆動コンピューティングの新時代を迎え、企業は構造的な課題に直面しながらも急速に拡大しています。

パウロ: PC大手、ASUS 1月5日より価格改定 さぁインフレが始まるっ https://t.co/Vpq4iFweh0

Abacus AI CEO、2025年版ベストAIモデル発表【年末総括】

  • Abacus AIのCEOであるBindu Reddy氏が、恒例となっている各分野のベストAIモデルリストの2025年総括版を公開しました。
  • コーディングではAnthropicのOpus/Sonnet 4.5、画像生成ではNano Banana Pro、動画生成ではSora-2やKling 2.6が選出されています。
  • 思考・調査ではGemini 3.0、リアルタイム処理ではGrok 4.1、汎用高速モデルとしてGPT-5.2などが挙げられました。
  • 氏のリストは今年注目を集めてきましたが、年末版では各社の最新モデルが名を連ねる結果となりました。
Bindu Reddy: (翻訳) クラス最高モデル - 2025年最終版 コーディング - opus and sonnet 4.5 画像 - nano banana pro 動画 - sora-2, kling 2.6 計画 - gpt 5.2 思考研究 - gemini 3.0 リアルタイム - grok 4.1 最高の小規模モデル - gemini flash 3.0 汎用高速モデル - gpt 5.2 大き...

Haider.: (翻訳) どのモデルもまだリードしているとは思いません。特にコーディングでは、opus 4.5は少し怠け者で、複数回のプロンプトが必要になることが多いですが、gpt-5.2は作業を再確認し、あまり手間をかけずに自分でデバッグできます。非常に遅いですが、実際に機能するので気にしません。

LangChain CEO、新概念「バックグラウンドエージェントインフラ」を提唱

  • LangChainのCEOであるHarrison Chase氏が「バックグラウンドエージェントインフラ」が2026年のトピックになるだろうと発言し、開発者の間で議論を呼んでいます。
  • これは、ユーザーの操作なしに自律的にタスクを実行し続けるAIエージェントを支えるための基盤技術を指すと考えられます。
  • 具体的には、ToDo管理、会話履歴の要約、ナレッジの蓄積と活用、サブエージェントの管理と修正といった複雑な機能群が必要になると見られています。
  • エージェントがより高度な自律性を獲得する上で、こうしたバックグラウンドで動作するインフラの設計が、今後の重要な開発テーマとなりそうです。
Harrison Chase: (翻訳) 「バックグラウンドエージェントインフラ」の構成要素は何ですか?

SHINJI KIMURA: エージェントが自分で、Todo管理、会話履歴、要約、ユーザーの性格把握、ナレッジ蓄積、組織全体のグローバルナレッジ、記憶の挿入方法、現状のシチュエーション理解、サブエージェントの定期的フィードバックと修正、メインオーケーストラのフィードバックと修正。サブエージェントの新規作成権利を承

SHINJI KIMURA: 物事の判断というのは、フィードバックループによる正しい判断できる回路の収束値を求めることなんだよね。 そうすると、いかにエージェントに収束値を求めていくかという仕組みを入れていく事が大切ですね。

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください