2025年12月29日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

AIコーディング論争とGPT-5.2の実用性、米中研究競争の最前線

本日はAIコーディングエージェントを巡る議論が一段と活発化しています。Andrew Ng氏やGreg Brockman氏ら著名人も参加し、開発速度と技術的負債のバランスについて活発な意見交換が行われています。

GPT-5.2の実用性を示す続報も入っており、リサーチやコーディングでの高い性能が報告されています。また、NeurIPS 2025の分析からは米中のAI研究競争が接戦状態にあることが明らかになりました。

その他、韓国NaverのオープンモデルやAIロボティクスの進展など、注目トピックをお届けします。それでは詳細をご覧ください。

目次

  1. AIコーディング巡る議論活発化、著名人も言及
  2. GPT-5.2続報、リサーチやコーディングでの実用性示す報告
  3. SK Hynix、米に先端半導体後工程の工場建設を検討
  4. Naverの新モデルがGemini 3 Proの性能超えか
  5. 有名AIの多くはサイドプロジェクトから誕生か
  6. AIロボット活用、洗濯物たたみや建設現場の作図も
  7. AI安全対策に新たな脆弱性、感情表現で回避の恐れ
  8. AIエージェントの評価と高速化に新手法が登場
  9. AI研究開発で米中が接戦、米国は産業界が主導

AIコーディング巡る議論活発化、著名人も言及

  • AIコーディングエージェントの活用を巡る議論が、Andrew Ng氏やGreg Brockman氏といった著名人も加わり、さらに活発化しています。
  • Greg Brockman氏は、エージェントを信頼しコードをレビューせずにデプロイするワークフローを共有し、注目を集めました。
  • 一方で、AI生成コードをレビューしない「Vibe Coding」は、短期的な開発速度と引き換えに、長期的な技術的負債を生む危険性も改めて指摘されています。
  • 開発者の間では、ツールの使い分けやプロンプトの工夫など、AIの能力を最大限に引き出しつつ、リスクを管理するためのベストプラクティス模索が続いています。
Andrew Ng: (翻訳) 本日、Claude Codeに関する話題が多数あがっています。Anthropic社と共同で作成したこの短いコースは、その使い方を学ぶのに最適な方法です。ぜひお楽しみください!

Greg Brockman: (翻訳) コーディングエージェントを活用して迅速にリリースする方法:

からあげ: 最近、ブラウザやスマートフォンで普段使いするAIはGemini、コーディングはClaude Codeって感じで落ち着いてきました

GPT-5.2続報、リサーチやコーディングでの実用性示す報告

  • GPT-5.2の実用性に関する続報です。
  • あるユーザーは「GPT 5.2 X High」を5時間にわたるリサーチに利用し、「これまでにない最高のリサーチ深度と品質」と絶賛しています。
  • また、コーディングエージェント「Codex CLI」で39日間に1000億トークンを使用したという報告もあり、専門的なタスクでの高い実用性が示されています。
Greg Brockman: (翻訳) レポート作成のためのGPT-5.2:

Kevin Weil 🇺🇸: (翻訳) これはワイルドで印象的だ...そして12〜24ヶ月後には当たり前のように見えるだろう。

SK Hynix、米に先端半導体後工程の工場建設を検討

  • 韓国の半導体大手SK Hynixが、米国に先端半導体の後工程工場を建設することを検討していると報じられました。
  • AI半導体の需要増で供給不足が続く、TSMCの先端パッケージング技術「CoWoS」への依存を減らす狙いがあるとみられています。
  • Samsungに続く動きとして、韓国企業による米国内での先端パッケージング生産能力拡大が注目されます。
Jukan: (翻訳) 速報:SK hynixがCoWoS需要に対応するため2.5Dパッケージング事業に参入…米国でのパッケージング工場建設を協議中と報道(ZDnet Korea)

Jukan: (翻訳) 韓国の半導体大手2社は、現時点では基本的に台湾を煽っている(笑)。TSMCが米国での工場建設をためらったとき、サムスンはテイラー工場の生産能力を倍増させた。そして今、TSMCが米国でのCoWoS工場の建設に意欲的でないようなので、SK

パウロ: まじか Si Hynix CoWoS対抗の2.5Dパッケージングラインを米国工場に? これは続報に期待
  • 韓国のインターネット大手Naverが、オープンな推論モデル「HyperCLOVA X SEED Think」を公開しました。
  • この32Bモデルは、AIモデルの性能評価指標「Artificial Analysis Intelligence Index」で44点を記録し、Gemini 3 Proを上回る性能を示したと報告されています。
  • 韓国のモデルとしては最も強力なものの1つであり、新たな高性能オープンソースモデルとして注目されます。
Jukan: (翻訳) NaverのAIモデルがベンチマークでGemini 3 Proを破る。

有名AIの多くはサイドプロジェクトから誕生か

  • AI業界における多くの画期的なプロダクトが、実は「サイドプロジェクト」から生まれているという指摘が話題になっています。
  • Claude Code、ChatGPT、PyTorch、Gmailなど、現在主力となっているサービスの多くが、企業内での本流のプロジェクトではなかったとされています。
  • この事実は、個人の興味や好奇心、裁量権が大きなイノベーションを生み出す原動力であることを示唆しています。
Yuchen Jin: (翻訳) DeepSeekはHigh-Flyer Quantのサイドプロジェクトでした。QwenはAlibabaのサイドプロジェクトでした。TwitterはOdeoのサイドプロジェクトでした。MacはAppleのサイドプロジェクトでした。一方、Windows PhoneはMicrosoftの中核プロジェクトでした。MetaverseはFacebookの中核プロジェクトでした。Google Gla...

AIロボット活用、洗濯物たたみや建設現場の作図も

  • AI技術のロボティクスへの応用が、家庭や建設現場など物理世界で進んでいます。
  • Weave Roboticsは、洗濯物を自動でたたむロボット「Isaac」を開発しました。
  • Dusty Roboticsは、建設現場の床に直接、設計図を印刷するロボットを開発し、作業の効率化に貢献しています。
Rohan Paul: (翻訳) ゆっくりと、しかし着実に、家庭用ロボットが簡単な雑用を引き継いでいます。これはWeave Roboticsが開発したIsaacで、カメラとセンサーを使って衣類を識別、ピックアップし、驚くほどの精度で折りたたみます。衣類1枚あたり約2分かかります。

Rohan Paul: (翻訳) Dusty Roboticsは、建物の現場で地面に直接間取り図を印刷することで、建設レイアウトを自動化するために設計された小型ロボットフィールドプリンターを実演しています。彼らは、業界標準よりも優れた性能を達成するために、体積位置フィードバックのためにレーザートラッカーを使用しています。

Rohan Paul: (翻訳) その瞬間が来た、ロボットの手は今や人間より速く、より正確に動く 🤯

AI安全対策に新たな脆弱性、感情表現で回避の恐れ

  • 現在のチャットボットの安全対策は、ユーザーが感情的・学術的な表現を使うことで回避できる脆弱性があるという論文が発表されました。
  • また、PDFに隠されたテキストでAI査読者を騙す手法や、建設業界でAIを悪用し工事の完成を偽装する工作など、新たな悪用事例も報告されています。
Rohan Paul: (翻訳) この論文は、今日のチャットボットの安全性には欠陥があると主張しています。なぜなら、モデルはユーザーの意図を検知できないことが多く、そのため人々は感情的または「学術的」な表現を使って安全策を回避し、有害な助けを得ることができるからです。60回の試行では、「思考モード」は安全でない回答をより正確にすることが多く、代わりに

Rohan Paul: (翻訳) この論文は、PDFに隠されたテキストがAI査読者をどのように騙すか、そして編集者がそれをどのように見抜くかを示しています。小規模なテストでは、防御側は10本の攻撃された論文と10本のクリーンな論文を間違いなく分離しました。弱点は、査読者が論文をチャットボットに貼り付けることが多く、チャットボットは

Rohan Paul: (翻訳) 建設業界では現在、AIを使って完成した作業を偽装し、偽の完成を演出する人々が見られます。現場を歩かなければ、あなたは現実を最高のプロンプトを持つ誰かにアウトソーシングしていることになります。😃

AIエージェントの評価と高速化に新手法が登場

  • Google Cloudの専門家が、AIエージェントの評価にはシステム全体の評価が必要であると指摘しています。
  • LLMエージェントの無駄な処理を削減し、タスク完了速度を最大2.5倍に高速化するフレームワーク「AgentInfer」の論文が公開されました。
Google Cloud Tech: (翻訳) 従来のソフトウェアテストは入力と出力を比較します。しかし、AIエージェントでは、システム全体を評価する必要があります。@anniewangtechがその方法をここで解説しています→

Rohan Paul: (翻訳) この論文は、大規模言語モデルエージェントのフルスタック高速化であるAgentInferを構築し、精度を損なうことなく無駄な作業を削減します。無駄なトークンが50%以上削減され、無意味なテキスト生成が減り、タスク完了が約1.8倍から2.5倍高速化されると報告されています。彼らはテキストを保持します

AI研究開発で米中が接戦、米国は産業界が主導

  • AI分野のトップカンファレンスであるNeurIPS 2025の論文投稿者に関する分析が公開され、米中の研究開発競争の激化が示されました。
  • 国別の貢献度では中国と米国がほぼ互角となっており、AI研究における中国の存在感の大きさを改めて示しています。
  • 米国内では、Google DeepMindやMeta、Microsoftといった企業研究所が、スタンフォード大学などのトップ大学に匹敵する貢献を見せており、産業界主導の研究へのシフトが鮮明になっています。
Rohan Paul: (翻訳) NeurIPS 2025の論文貢献者トップ50は、中国と米国が僅差であることを示しています。米国では、Google DeepMind、Meta、Microsoftなどの企業研究所が、スタンフォード、CMU、MITなどのトップスクールに匹敵するようになり、業界主導のAI研究への大きなシフトを示しています。中国のリーダーは依然として学術的です:清華大学、

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください