14 6月 2025

2025年06月14日朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

「Claude」と「Grok」 AIアシスタント機能拡充の動き加速

AIアシスタント技術が日々進化しています。AnthropicがClaude Researchのマルチエージェント技術を公開し、GrokのTasks機能UIがリークされました。

一方でコード支援分野では、Claude CodeでのJSONSchema活用法が開発者間で共有され、OpenAI Codexは複数回答を同時生成する機能を追加。o3-proはデバッグ能力で評価も応答速度に課題が指摘されています。

それでは各機能の詳細について見ていきましょう。

Claude Code続報: JSONSchema活用など新たな開発手法が話題に
Anthropic、Claude Research機能のマルチエージェント技術を公開【続報】
OpenAI Codex続報、複数回答を同時生成する機能追加
o3-pro評価続報、デバッグ能力は高評価も応答速度に課題
Grok新機能「Tasks」のUIがリーク、実装間近か【続報】
NVIDIAのペルソナデータセット、Hugging Faceで1位に【続報】
デジタル庁の「ガバメントAI」開発計画に疑問の声

Claude Code続報: JSONSchema活用など新たな開発手法が話題に

AnthropicのAIコーディング支援ツール「Claude Code」に関する続報です。開発者コミュニティでは、具体的な活用方法の議論がさらに活発化しています。
UIフロントエンドを直接構築せず、コアドメインをJSONSchemaのようなデータ記述フォーマットに定義する手法が、効率的なAIツール開発のコツとして共有され、注目を集めています。
また、エディタに統合されていない点が、逆にツールの自律性を感じさせ使いやすいという新しい視点からの評価も出ています。
一方で、公式SDKに型定義がないなど、ツールとしての未整備な点も指摘されており、今後の改善とエコシステムの発展が期待されます。

mizchi: CLINE に全部賭けろが代表作だと思われると、Claude Code が流行ってる今自己紹介しづらくなるので、 Claude Code 版を書いたわけですが...

mizchi: Claude Code でわかった AIツール開発のコツの一つは、UIフロントエンドを作らずコアドメインを JSONSchema みたいなデータ記述フォーマットにすること(知ってた)

Kai INUI: これめっちゃわかるエディタと統合されてないからこそ、逆に自律的に感じるし、なんか楽にも感じる。なぜか。性能だけではなくて感覚的な問題な気もしてる (引用ツイート: Claude Codeが凄いのはClaude 4だからじゃない。それならCursorもすごくなる。Bashが使えるからすごい。まあそれもある。でも本当にCursorと違うのは作業中の「手が出せなそう感」だと思う。Cursorは途中介入...

Anthropic、Claude Research機能のマルチエージェント技術を公開【続報】

先日お伝えしたAIモデル「Claude」の高度なResearch機能について、Anthropicがその技術的背景を公式ブログで公開しました。
この機能は、単一のAIではなく、複数のエージェントが並行して動作するマルチエージェントシステムによって構築されているとのことです。
ブログでは、開発アプローチで機能した点・しなかった点や、直面したエンジニアリング上の課題が詳しく解説されています。
大手AIラボによる具体的なマルチエージェントシステムの構築事例として、今後のエージェント開発の参考になりそうです。

Anthropic: (翻訳) Anthropic Engineeringブログの新着記事：複数のエージェントを並行して使用して、クロードの研究能力をどのように構築したか。何が機能し、何が機能しなかったか、そしてその過程でのエンジニアリングの課題を共有します。 https://t.co/k3Gzd4HkLg

Carlos E. Perez: (翻訳) マルチエージェンシーの問題と解決策問題1：コンテキストの断片化解決策：共有コンテキスト+圧縮により、すべてのエージェントが同じ理解から作業できるようになります実装：すべてのエージェントが圧縮された完全な履歴を表示します問題2：暗黙的な決定の競合解決策：

Carlos E. Perez: (翻訳) AnthropicのLLMは、マルチエージェントのコラボレーションをサポートするようにトレーニングされているのではないかと疑っています。方法は？それが彼らの秘伝のタレです！マルチエージェントは、エージェントAIと同じではありません。別のゲームです。違いを知りたい場合は「いいね！」してください！話す前に最低100の「いいね！」が必要です。

OpenAI Codex続報、複数回答を同時生成する機能追加

OpenAIのコーディング支援AI「Codex」に関する続報です。一度に複数の回答を生成する「Best-of-N」機能が追加されました。
この機能により、ユーザーは単一のタスクに対して最大4つまでの異なる解決策を同時に生成させ、その中から最適なアプローチを迅速に選択できるようになります。
Pro、Enterprise、Team、Edu、Plusユーザー向けに順次展開される予定で、開発効率のさらなる向上が期待されます。

TestingCatalog News 🗞: (翻訳) Codexは、複数の応答（最大4つ）を同時に生成できるようになりました！https://t.co/k4NWNaaZiF （引用ツイート：Codexは、単一のタスクに対して複数の応答を同時に生成できるようになり、考えられる解決策をすばやく検討して最適なアプローチを選択するのに役立ちます。Best-of-Nは、本日よりPro、Enterprise、Team、Edu、およびPlusユーザーに...

Kazuhiro Sera (瀬良): 🎯 OpenAI の Codex に Best-of-N 機能が追加されました！これは一つのタスクに対して最大 4 つまで別バージョンの回答を同時に作成させ、その中から最も優れたものを選べるというものです。利用方法は元の投稿の動画をご覧ください。利用できるようになったらぜひ試してみてください！ (引用ツイート: Codex can now generate multiple respons...

o3-pro評価続報、デバッグ能力は高評価も応答速度に課題

OpenAIのo3-proモデルに関する続報です。
開発者から、検索能力と組み合わせることで高いデバッグ能力を発揮するとの声が上がる一方、Claude Codeと比較して「考えすぎる」ため応答が遅いという指摘も出ています。
また、ユースケースによってはo3の方が適しているという報告や、カスタムGPTのエディタで正常に動作しない問題も挙がっており、多角的な評価が続いています。

西見公宏 | Generative Agents: Claude Codeはultrathinkだけど、o3-proはoverthinkingだな。永遠に応答が返ってこない。

Kai INUI: o3-pro、検索能力も相まってかなりデバッグ能力高いかもしれない

Bindu Reddy: (翻訳) 笑、今日リポジトリに10回コミットした！ Sonnet 4、Opus思考、o3を連携して使わなければならなかった。o3-proは全く役に立たなかったことを確認できる... o3の方がずっと良かった。なぜSWEをやめたのか分からない😭😭

Grok新機能「Tasks」のUIがリーク、実装間近か【続報】

xAIが開発する「Grok」の新機能「Tasks」に関する続報です。
新たにUIのスクリーンショットがリークされ、タスクの実行状況を確認する画面や、完了を知らせるメール通知機能の存在が明らかになりました。
以前報じられた自動情報収集・メール送信機能の具体的なUIが示されたことで、パーソナルアシスタントとしてのGrokの正式実装が近いことを示唆しています。

Tech Dev Notes: (翻訳) Grokタスクアプリの通知+メール https://t.co/PVkCFEIBGf

Tech Dev Notes: (翻訳) GrokタスクUI https://t.co/q9nl7J6O8M

TestingCatalog News 🗞: (翻訳) 「スケジュールされたタスク」の週は続きます。Manus AIもスケジュールされたタスクをサポートするようになりました！ - ✅ ChatGPT - ✅ Perplexity - ✅ Manus AI - 🚧 Grok - 🤷‍♂️ Gemini - 💀 Claude https://t.co/tFGGMLimjY

NVIDIAのペルソナデータセット、Hugging Faceで1位に【続報】

先日お伝えしたNVIDIAの合成ペルソナデータセット「Nemotron-Personas」に関する続報です。
このデータセットがHugging Faceのデータセットランキングで1位を獲得し、改めて注目を集めています。
60万件のペルソナを含み、LLMのトレーニングやRAGなどに活用できるとして、研究および商用利用が可能です。

NVIDIA AI Developer: (翻訳) 私たちの新しいNemotron-Personasデータセットが@huggingfaceで1位になりました🎉 それは何ですか？ 🤗現実世界のデータに基づいた60万人のペルソナ 🏗️合成データ生成のための複合AIシステムで構築 📜研究および商用利用は無料 LLMトレーニング、レッドチームなどに最適です。https://t.co/Cqbu5UPKMS

デジタル庁の「ガバメントAI」開発計画に疑問の声

デジタル庁が、政府独自のAI基盤「ガバメントAI」（仮称）を2026年度までに開発・提供する計画を発表しました。,
この計画に対し、SNS上では地方公共団体向けのガバメントクラウド構築の実績などを踏まえ、デジタル庁の技術力や実行能力を疑問視する声が上がっています。,
政府のAI活用方針の具体化として注目される一方、その実現性については厳しい目が向けられています。,

Yuta Kashino: デジタル庁、政府のAI基盤「ガバメントAI」（仮称）を開発へ　26年度までの提供目指す https://t.co/tYcCG21UMf キミらさ，地方公共団体向けのガバメントクラウドを構築する能力も技術力も統率力も無い https://t.co/svpybgPg3W のに，そんなの構ってる余裕あるはずないじゃん…