30 5月 2025

2025年05月30日夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Sakana AIの自己改善システム登場、各社のAI開発競争が加速

今週のAI業界では、Sakana AIによる画期的な自己改善システム「Darwin Gödel Machine」の発表が大きな注目を集めています。DeepSeek R1の最新版がGemini 2.5 Pro級の評価を獲得し、AnthropicのClaude WebアプリにはArtifacts Gallery機能追加の動きも。

OpenAIの企業ユーザーは300万人を突破し、高性能モデル「o3-pro」のリリース噂も広がっています。一方、NVIDIA製AIチップへの需要は堅調ながら、中国企業は代替手段を模索中との報道も。

それでは各トピックの詳細を見ていきましょう。

Sakana AI、自己改善AI「Darwin Gödel Machine」発表
DeepSeek R1続報: JSON/FC対応、Gemini 2.5 Pro級評価
Claude、新機能Artifacts GalleryとCode活用、採用にも
Google開発者向けAIツール強化続々 Gemini APIやJules CLI案等【続報】
OpenAI企業ユーザー300万人突破、o3-pro登場の噂も【続報】
Kaggle、センサー行動検知など新コンペ複数開始
【続報】NVIDIAチップ需要堅調、中国は代替模索とFT報道
AI開発: MCP採用進む(Mistral等)、CLI再評価、ツール多数
Grammarly大型調達、Xiaomi VLM公開、LLM-jp-3.1登場

Sakana AI、自己改善AI「Darwin Gödel Machine」発表

Sakana AIが、AI自身がコードを書き換えて自己改善する「Darwin Gödel Machine (DGM)」を発表しました。
進化論に着想を得ており、エージェントの系統を維持・拡大しながら新たな能力を獲得していく仕組みです。
SWE-benchやPolyglotといったベンチマークで大幅な性能向上が報告されており、AIの自律的な進化に期待が寄せられています。

Sakana AI: (翻訳) ダーウィン・ゲーデル・マシンのご紹介：自身のコードを書き換えることで自己改善するAI https://t.co/tBzlhoUMZO ダーウィン・ゲーデル・マシン（DGM）は、自身のコードを修正できる自己改善エージェントです。進化に触発され、私たちはエージェントの亜種の系統を拡大し維持しています。 https://t.co/yIQ0w85N7U

Jeff Clune: (翻訳) ダーウィン・ゲーデル・マシンのご紹介：自己改善エージェントのオープンエンドな進化。私たちは、オープンエンドなアルゴリズムの力を活用して、自身のコードの改善を含むコーディング能力が向上するエージェントシステムを探求します。これはエージェントシステムの自動設計です。

Sakana AI: 自己改善するAIを現実に：ダーウィン・ゲーデルマシン（DGM）の提案ブログ：https://t.co/4GKpPVAs1A 論文：https://t.co/Ej2KIkEXdh 人間のように学び続け、どこまでも自己改善するAIは作れるか──これはAI研究の長年のゴールでした。 20数年前、ユルゲン・シュミットフーバー教授が提案した https://t.co/C5mIvxnuuJ

DeepSeek R1続報: JSON/FC対応、Gemini 2.5 Pro級評価

中国発の大規模言語モデルDeepSeek R1の最新版「R1-0528」に関する続報です。
引き続き、コーディングや数学、科学分野のベンチマークでGoogleのGemini 2.5 Proに匹敵する性能と評価されています。
アーキテクチャ変更なしでの大幅な性能向上に加え、新たにJSON出力とFunction Callingへの対応、ハルシネーションの軽減が報告されました。
コミュニティでは、動的1bit量子化による軽量化の試みや、Qwen3-8Bベースのggufフォーマット変換版の公開など、活用が進んでいます。

Rohan Paul: (翻訳) 🔥 DeepSeek R1-0528がAIランキングでGoogleのGemini 2.5 Proと2位タイに並びました。数学で+21ポイント、コードで+15ポイント、科学で+10ポイントと、Meta、xAI、Anthropicを上回っています。アーキテクチャの変更なしで達成されました。 Artificial Analysis Intelligence Indexではスコア68です。 →...

まつにぃ: 改めてDeepseekの公式からDeepSeek-R1-0528の性能が発表。微修正だけとは思えないレベルで、AIME2024 が91.4%上昇するなど主要指標が前版比で大幅改善し、o3・Gemini2.5級の次世代に肩を並べています。 Json出力とFunction Calling対応で、ハルシネーションも軽減これはR2どうなってしまうんだ..

Daniel Han: (翻訳) DeepSeek-R1-0528用の動的1ビット量子化を作成しました。713GBから185GBへと74%小型化しました。MoEレイヤーをRAMにオフロードするために、魔法の呪文「-ot ".ffn_.*_exps.=CPU"」を使用すると、MoE以外のレイヤーが16Kコンテキストで24GB未満のVRAMに収まります！残りはRAMとディスクに配置されます。量子化はこちら：https://...

Claude、新機能Artifacts GalleryとCode活用、採用にも

AnthropicのClaude Webアプリに、生成物を一覧・再利用できる「Artifacts Gallery」(旧称 Artifacts Studio)機能が追加されるとの情報が浮上しました。
開発者の間では、Claude Codeを活用したコーディングやIssueトリアージなど汎用エージェントとしての利用可能性が活発に議論されており、これは過去にお伝えしたClaude Codeの高評価やIDE対応に続く動きです。
また、Anthropic社内では採用プロセスにおいて、Claudeを使って課題解決を行う演習を取り入れていることも明らかになりました。

まつにぃ: 逆に今まで無かったのかAnthropic が「Artifacts Studio」を公開予定です。これは名前の通り、Claude が生成した作品群を一覧し、リミックスや全文チャット閲覧が可能になります。既存の Publish/Remix 機能も統合し、よりユーザー同士でコラボレーション開発を行い易いハブを目指しています。

TestingCatalog News 🗞: (翻訳) ClaudeのArtifactsギャラリーのプレビュー👀 金曜日の機能リリースとしては良さそう！ https://t.co/vgYjbSWXOf

西見公宏 | Generative Agents: Claude Codeってコーディングエージェントのみならず、普通に汎用エージェントとしてのユースケースが山ほどありそうだなと、公式のリポジトリでの運用を見て思いました。 👇のURLはIssueをエージェントがトリアージする仕組み。Claude Codeへのプロンプトで書かれてる。 https://t.co/Eiyl1Klvjh

Google開発者向けAIツール強化続々 Gemini APIやJules CLI案等【続報】

GoogleによるAI開発環境の強化に関する続報です。
crewAIのGeminiドキュメントが更新されました。
Dataflowでエンベディング生成がサポートされました。
Cloud RunへMCPサーバーをデプロイする機能が追加されました。
非同期コーディングAI「Jules」のCLI版提供が検討されています。
Chrome DevToolsとGeminiが連携し、CSSを直接編集できる機能が登場しました。

Philipp Schmid: (翻訳) @crewAIInc のGeminiドキュメントを更新し、より簡単に始められるようにしました！ぜひご覧いただき、ご意見をお聞かせください。 https://t.co/lshvf2cY2p https://t.co/WJOsACrv2P

Kazunori Sato: Dataflowがエンべディング生成に対応。 (引用ツイート: Streaming embeddings generation with Vertex AI is now GA in Dataflow! You can use Apache Beam MLTransform with Dataflow to build scalable, real-time pipelines for y...

Addy Osmani: (翻訳) @ChromeDevTools の新機能：Gemini が CSS の変更をソースに直接修正・保存できるようになりました！ DevTools からエディタに CSS の変更を手動でコピーするのにうんざりしていませんか？Gemini にお任せください！AI Assistance パネルで Gemini に次のことを依頼できるようになりました： ✨ Elements 内の CSS を修正・...

OpenAI企業ユーザー300万人突破、o3-pro登場の噂も【続報】

OpenAIのエンタープライズユーザー数が300万人を突破したと報じられました。これは2025年2月から50%の増加となります。
また、以前から噂されていた高性能モデル「o3-pro」のリリースが間近であるとの情報も引き続き報じられています。
OpenAIの所有権再編案については、非営利団体からの支持を得られておらず、州規制当局への働きかけが続いている模様です。

morgan —: (翻訳) OpenAIのエンタープライズユーザーは2月から50%増加し、300万人を超えました。 https://t.co/TYV2zWDxSd

Rohan Paul: (翻訳) @OpenAI の o3-pro が間もなく登場か？（引用ツイート：@OpenAI による o3-pro のリリースが間近で、今日か明日かもしれないという噂です！）

The Information: (翻訳) OpenAIは再編のために司法長官を説得する必要がある OpenAIの所有権再編に関する修正案は、非営利団体の支持を得ておらず、彼らは州の規制当局に変更を求めている。 @rocketalignment の詳細はこちら👇 https://t.co/GpCEzPCfd7

Kaggle、センサー行動検知など新コンペ複数開始

Kaggleで新たなコンペティションが複数開始され、データサイエンティストたちの注目を集めています。
手首に装着したセンサーデータ（IMU、温度、LiDAR）から特定の行動を検知する「CMI - Detect Behavior with Sensor Data」が公開されました。
また、過去15年間のKaggleの活動記録を分析し、コミュニティのAI/MLへの貢献を可視化・考察する「Meta Kaggle Hackathon」も開催中です。

Kagoole: (翻訳) 新しい#kaggleコンペティション「CMI - センサーデータで行動を検出」が開始されました。メダル：ありカーネルのみ：あり締め切り：2025-09-02 23:59:00+00:00 https://t.co/UOvjDEuAl1

カレーちゃん: Kaggleの新コンペ: Meta Kaggle Hackathon 15年分のKaggleの活動を記録したMeta Kaggle / Meta Kaggle Code を分析し、「KaggleコミュニティはAI/MLの進歩にどのように貢献してきたか？」を可視化・考察する。・賞金あり、メダルなし・7/21まで https://t.co/DyCqJuoqV7

エチレン: It's lonely here at the top. #kaggle - https://t.co/wcSGUDk7Hx Thrilled to be back at #1—and extra proud that my teammate daiwakun just cracked the top 10 for the very first time! https://t.co/sIe021k...

【続報】NVIDIAチップ需要堅調、中国は代替模索とFT報道

NVIDIA製AIチップへの需要は依然として高く、DellのAIサーバー受注も好調です。
その一方で、米国の対中関税措置が続く中、Financial Timesは中国テック企業がNVIDIA製以外の半導体テストを進め、代替手段を模索していると報じました。
この状況は、今後のAI半導体市場の勢力図に変化をもたらす可能性があります。

TechCrunch: (翻訳) Nvidiaはトランプ政権によって施行された関税によって大きな打撃を受けています。第1四半期だけで、同社はH2O AIチップを中国企業に販売する能力に影響を与えるライセンス要件により45億ドルの費用を計上し、さらに25億ドルの収益機会を逃しました。https://t.co/E5oYxZAzCH

パウロ: DellのAIサーバー $12.1Bの受注がこの四半期だけできた (引用ツイート: Dell $DELL on AI servers: "We generated $12.1 billion in AI orders this quarter alone, surpassing the entirety of shipments in all of FY25 and leaving us ...

Financial Times: (翻訳) 業界幹部によると、中国の大手テクノロジー企業は、急増するAI関連の内部需要と顧客ニーズに対応するため、代替半導体のテストを開始しました。https://t.co/2WRWRl49DP https://t.co/UoF54dKxa3

AI開発: MCP採用進む(Mistral等)、CLI再評価、ツール多数

AIエージェントとツールの連携プロトコルMCP(Model Context Protocol)の採用が進んでいます。Mistral AIのAgents APIがMCP互換になるなど、具体的な動きが見られます。
一方で、よりシンプルなコマンドラインインターフェース(CLI)を評価する声も上がっており、開発アプローチの多様性が示唆されています。
また、46種類ものAIコーディングエージェントやIDEをまとめたリストが共有されるなど、開発支援ツールの選択肢も増え続けています。

Harrison Chase: (翻訳) 私も同意見です。mcpはすでにツール＋プロンプト＋リソースですが、クライアント/サーバーの99%が使用しているのはツールだけです。なぜさらに追加する必要があるのでしょうか。（引用ツイート：@hwchase17 私見ですが、...1つの仕様は小さく/厳密にツール指向に保ち、大規模なエージェントオーケストレーション用にもう1つ作成するべきです。）

TestingCatalog News 🗞: (翻訳) ご参考：Mistral AIは、タスク計画とツール統合を備えたAgents APIを一般公開しました。Mistral AgentsはMCPとも互換性があります！エージェントがGitHubデモにPRを作成 👀 https://t.co/Vy5HLu905b

jian: (翻訳) MCPより良いものを見つけました。それはCLIと呼ばれています。

Grammarly大型調達、Xiaomi VLM公開、LLM-jp-3.1登場

AI英文校正ツールGrammarlyが、General Catalystから10億ドルという大規模な非希釈型資金調達を実施したことが報じられました。
Xiaomiは、7BサイズのVision Language Model (VLM) を研究者や開発者が利用しやすいMITライセンスで公開し、注目を集めています。
国産LLMのLLM-jpプロジェクトより、LLM-jp-3を基にした高性能モデルの続報として、指示追従性が大幅に向上した「LLM-jp-3.1」シリーズが新たにリリースされました。

TechCrunch: (翻訳) GrammarlyがGeneral Catalystから10億ドルの非希釈型資金を調達 | TechCrunch https://t.co/R5KqdWI9QX

Vaibhav (VB) Srivastav: (翻訳) Xiaomiからかなり印象的な7B VLMが登場 🤓 ViTエンコーダーとMLPを搭載し、同社の7Bテキストバックボーンを搭載 Qwen VLアーキテクチャと互換性があるため、vLLM、Transformers、SGLang、Llama.cppで動作しますボーナス：推論可能でMITライセンスです 🔥 https://t.co/3SEex3mlIx

龍一郎 (f.k.a Asei Sugiyama): この取り組みは継続してさまざまな手法を試していてとても偉い、技術的な検証も重要だし、言語資源があることも、さまざまな手法を試せるデータセットが作成できることも無料で手に入るものではないから (引用ツイート: LLM-jpモデルのラインナップに「LLM-jp-3.1」シリーズが追加されました。本シリーズでは、継続事前学習の追加およびinstruct4による事後学習の改善により、指示追従性が大幅...