2025年12月08日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Gemini 3 Flash正体判明とAI数学能力の飛躍的進歩
Googleの未発表モデル「oceanstone」が最新軽量モデルGemini 3 Flashであることが判明し、オープンな評価環境での性能比較が可能になりました。
また、AxiomProverが超難関数学コンテストPutnamで1位相当の成績を達成し、AIの汎用的問題解決能力が大きく向上していることが示されました。
さらに、NeurIPSでは「賢いスケーリング」への転換が提言されるなど、AI開発の方向性にも変化の兆しが見えています。
では、各トピックの詳細をご覧ください。
目次
- LMArenaの未発表モデル、Gemini 3 Flashと判明【続報】
- MS、自社ARM CPUでx86置き換えを加速
- 中国NAURA、3D NAND向け高精度エッチング装置開発で躍進か
- SK Hynix、HBM4の量産計画を延期 AI半導体市場に影響か
- AI、超難関数学コンテストPutnamで1位相当の成績
- Grok音声モード、アシスタント最高評価か 高速応答で【続報】
- AI研究の権威「賢いスケーリングの時代へ」と提言
- フルAIコーディングの具体論 ESLintや結合テストの重要性を指摘
LMArenaの未発表モデル、Gemini 3 Flashと判明【続報】
- 以前LMArenaで「oceanstone」として観測されていたGoogleの未発表モデルが、最新の軽量モデル「Gemini 3 Flash」であることが判明しました。
- これにより、他の主要モデルとの直接的な性能比較が可能になり、多くの開発者や研究者から注目が集まっています。
- Googleが継続的にモデルをリリースし、オープンな評価の場に提供する姿勢が評価されています。
ʟᴇɢɪᴛ: (翻訳) Gemini 3 FlashがLM Arenaに登場しました https://t.co/GaudzudiD8
Chubby♨️: (翻訳) 始まりました、LMArenaにGemini 3.0 Flashが登場。Googleは提供し続けます!
Kol Tregaskes: (翻訳) Gemini 3 FlashがLM Arenaで確認されました。 https://t.co/pk57r9zVt2
MS、自社ARM CPUでx86置き換えを加速
- Microsoftが、データセンターのCPUをIntelやAMDのx86ベースから自社設計のARMベースCPU「Cobalt 200」へ大規模に置き換える計画だと報じられました。
- これはAmazonの「Graviton」プロセッサに続く動きで、大手クラウド事業者がCPUを自社開発・最適化する流れが加速していることを示しています。
- この移行により、データセンターの電力効率とコストパフォーマンスが大幅に向上する可能性があります。
Jukan: (翻訳) 「マイクロソフトが自社設計した3nmのCobalt 200 CPUは、自社のデータセンター内でAMDおよびIntelのx86 CPUを大規模に置き換える予定です。」 これは、Amazonもカスタム設計のARM CPUでx86 CPUを置き換えていると指摘した最近のセルサイドレポートを思い出させます。https://t.co/gIcun0ihRN
パウロ: x86 CPU データセンターでまたも置き換えへ Microsoft 3nm Cobalt 200 CPU ArmベースでAMDとIntelのx86 CPUを置き換えへ
中国NAURA、3D NAND向け高精度エッチング装置開発で躍進か
- 中国の半導体製造装置メーカーNAURAが、300層以上の3D NANDフラッシュメモリ製造を可能にする可能性のある、90:1の高アスペクト比エッチング技術で大きな進歩を遂げたと報じられています。
- これが事実であれば、半導体製造装置市場において、Lam Researchや東京エレクトロンなどの既存大手企業にとって大きな脅威となる可能性があります。
- 米国の制裁下で中国の半導体技術が独自の進化を遂げていることを示す事例として注目されています。
Jukan: (翻訳) 我々は本当にまずい状況だ(笑) UBS:「NAURAおよび中国のWFEサプライチェーンとの最近の議論によると、NAURAは90:1の高アスペクト比エッチングで大きな進歩を遂げ、300層以上の3D NANDフラッシュ生産を可能にする可能性があることを示唆している。これは市場の拡大を意味する可能性がある」
パウロ: あーあ 中国 半導体製造装置メーカーNAURA 3D NANDの鍵となる300層クラスのエッチング装置開発へ 本当だったらLam Researchと東京エレクトロンにはバッドニュース
SK Hynix、HBM4の量産計画を延期 AI半導体市場に影響か
- AI向けHBMで市場をリードするSK Hynixが、次世代製品「HBM4」の量産開始を延期し、生産能力の増強ペースを遅らせると報じられました。
- 同社のHBMは2026年分まで完売と報じられるなど需要が旺盛でしたが、今回の計画調整はその流れに変化をもたらす可能性があります。
- この動きは、AI半導体市場の需要と供給のバランスや、NVIDIAなど主要顧客の製品ロードマップに影響を与える可能性があります。
Jukan: (翻訳) Rubinは遅延しました。https://t.co/Hu83IVWyN3
AI、超難関数学コンテストPutnamで1位相当の成績
- AIによる数学的推論能力の進歩を示す顕著な例として、AxiomProverが世界で最も難しいとされる大学レベルの数学コンテスト「Putnam」で12問中9問を自律的に解いたことが報告されました。
- このスコアは、昨年の参加者約4000人の中で1位に相当し、トップ5入賞者である「Putnam Fellow」レベルに匹敵するものです。
- テストデータでの学習なしにこの成果を達成したことは、AIの汎用的な問題解決能力の向上を示唆しています。
Thomas Wolf: (翻訳) なんてことだ 🤯 - Putnam 2025で12問中9問正解! AIと数学に詳しくないと、ここで得られた驚異的な結果を見逃すかもしれません。 説明: - テストセットでのトレーニング/ベンチマークハッキングは一切なし!モデルは学生と同時に2025年の問題を自律的に発見/処理しました。
Miles Brundage: (翻訳) 数学に詳しい方々へ - 公式なコンペティションとして、パトナムよりレベルの高いものはありますか?
Grok音声モード、アシスタント最高評価か 高速応答で【続報】
- 先日ロールアウトが報じられたxAI「Grok」の音声モードについて、その性能を高く評価する声が上がっています。
- 高速な応答速度と自然な会話の流れが特徴で、現在利用可能な音声アシスタントの中で総合的に最も優れているとの評価です。
- 適切なプロンプトを設定することで、質問やタスクの割り当てがスムーズに行える点も強みとされています。
- 競合としてはGemini Flashの音声モードが挙げられていますが、Grokの体験がそれを上回るとの意見です。
Haider.: (翻訳) grokの音声モードは現在、全体的に最高です。 驚くほど速い遅延、そして声のタイミングと流れにより、メインプロンプトをうまく設定すれば、質問したりタスクを割り当てたりするのが簡単になります。 gemini flashの音声は2番目に良い選択肢で、gptの音声よりわずかに優れています。 しかし、それでもまだ
AI研究の権威「賢いスケーリングの時代へ」と提言
- 世界最高峰のAI学会NeurIPSにて、ワシントン大学のYejin Choi教授が「力任せのスケーリングの時代は終わり、より賢いスケーリングへ」と提言し、注目を集めている。
- 講演では、単にモデルサイズを大きくするだけでなく、推論能力を高めるための新しいアプローチの重要性が強調された。
- この提言は、今後のLLM開発の方向性に大きな影響を与える可能性がある。
Shohei Hido @ NeurIPS 2025✈️: NeurIPS2025、田部井さんも挙げてたYejin Choi教授の講演が一番印象的だった。本会議でもGRPOでReasoning能力上げる論文がたくさんあったけど、独自LLM開発のやる気を後押ししてくれる。 配信動画は一般公開じゃないので、10月にYann LeCunと並んだ基調講演@韓国をリンク。 https://t.co/vRg86GEEV2 https://t.co/TxQHnTysE...
フルAIコーディングの具体論 ESLintや結合テストの重要性を指摘
- AIを活用したプロダクト開発「フルAIコーディング」について、実践的なノウハウを解説した記事が公開され、注目を集めています。
- 記事ではLLMを「極めていびつな汎用知性」と捉え、その特性を活かすための環境整備、特にESLintや結合テストの重要性を強調しています。
- AIとの協業を前提とした開発プロセスのシフトに関する具体的な知見が共有されており、多くのエンジニアにとって参考になる内容です。
erukiti: 「実践フルAIコーディング」という記事を公開しました。 https://t.co/tokMJggg7t 実践で、本格的なプロダクト開発をフルAIコーディングするための、僕の持つ考えたとノウハウをすべてを記事にまとめました。 ・LLM とは極めていびつな汎用知性です ・環境整備で勝負のそれなりが決まります
s-miyawaki | Algomatic Works: AIコーディングを使い倒しているえるきちさんが、AIコーディングのための考え方とノウハウを公開してくれている!🙌👀
株式会社Algomatic: 🎄 #Algomaticアドカレ 8日目 AIエンジニアのえるきち @erukiti が「フルAIコーディング」の実践知見を公開! 指示と矛盾のジレンマ、ESLintや結合テスト重視へのシフトなど、地上戦のノウハウが満載です💫 AIで開発を加速させたいエンジニアの方々、ぜひご覧ください🙌 https://t.co/Wauc0TKRzv