18 5月 2025

2025年05月18日朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

OpenAI・xAI・Googleの新機能ラッシュとAIエージェント普及の兆し

主要AI企業から相次ぐ新機能や改善の発表が続いています。OpenAIはCodexとChatGPT連携でAPIクレジット特典を開始し、xAIのGrokはMermaid図やスケッチパッド機能を追加予定です。GoogleもiOS版Geminiに新機能を追加し、AI動画編集ツール「Flow」の発表が期待されています。

同時に、GoogleのMCP標準化やGreg Brockman氏が述べた「2025年はAIエージェントの年」という予測など、AIエージェント技術への注目も高まっています。

それでは各トピックの詳細を見ていきましょう。

OpenAI Codex続報: ChatGPT連携でAPI無料クレジット
Grok続報: Mermaid図・スケッチパッド対応会話復元も
Gemini iOS新機能とAI動画編集Flow Google I/O発表期待
MCP標準化期待、Googleガイド公開や実用例登場【続報】
OpenAI G.ブロックマン氏も25年はAIエージェントの年 YC企業がAI雇用【続報】
Alibaba Qwen2.5-Omni-7B量子化版とスケーリング則研究
NVIDIA新チップGDDR7搭載か CEO発言も【続報】
Claude Code Pro版提供間近か ChatGPT o3新版テストも
LLM研究: 幻覚検出、RAG安全性、エージェント脆弱性など新報告

OpenAI Codex続報: ChatGPT連携でAPI無料クレジット

OpenAIのAIコーディングエージェント「Codex」に関する続報です。
ChatGPT経由でサインインすると、APIクレジットが付与される特典が開始されました。
Plusユーザーには5ドル、Proユーザーには50ドルのAPIクレジットが30日間提供されます。
このCodexは、以前発表されたo3ベースの「codex-1」モデルを利用しています。

OpenAI: (翻訳) ChatGPTでCodex CLIにサインインしたPlusおよびProユーザーは、今後30日間、それぞれ5ドルと50ドルの無料APIクレジットを利用できるようになりました。

Tibor Blaho: (翻訳) RedditでのOpenAI CodexチームとのAMA（2025-05-16）の概要起源と開発アプローチ - Codexは、社内モデルが日常業務で十分に活用されていないことに不満を感じていたOpenAIのエンジニアによるサイドプロジェクトとして始まりました。 - Codexにおける重要なパラダイムシフトは、タスクを並列処理することです。 https://t.co/VfOyLqO...

Greg Brockman: (翻訳) コード移行のためのCodex:

Grok続報: Mermaid図・スケッチパッド対応会話復元も

xAIの「Grok」に関する続報です。
既報のアスペクト比を指定した画像生成機能が追加されました。
さらに、ウェブ版にはMermaid形式の図を生成する機能や、手書きスケッチから画像を生成する「スケッチパッド」機能が近日中に搭載される予定です。
iOSアプリ版では削除した会話を復元するオプションも開発中と報じられています。

Tech Dev Notes: (翻訳) Grokが様々な比率で画像を描けるようになりました！ https://t.co/hZOVlvOmkg

Tech Dev Notes: (翻訳) Grok Webは間もなくMermaid図を生成できるようになります！ https://t.co/ejFtQbcPzy

Tech Dev Notes: (翻訳) スケッチ機能近日公開： https://t.co/tSa4WgZxWU

Gemini iOS新機能とAI動画編集Flow Google I/O発表期待

GoogleのAI「Gemini」のiOSアプリで、新たにCanvas機能が利用可能になったと報告されています（Canvasレンダリングは未対応）
間もなく開催されるGoogle I/Oでは、Veo・Imagen・Lyraを搭載した新しいAI動画編集ツール「Flow」が発表されるとの噂も出ており、期待が高まっています
これらに加え、Geminiについては全般的に高い評価や機能改善の報告が続いています

Chubby♨️: (翻訳) よくわからないけど、Googleがリードしているような気がする

TestingCatalog News 🗞: (翻訳) iOS版GeminiアプリでCanvasを開けるようになり、ウェブ版と同様の変更に続いてプロンプトツールバーが再設計されました。ただし、Canvasレンダリングはまだ利用できません。 https://t.co/jMM1yKGklr

Chubby♨️: (翻訳) Google I/Oの最初のリーク：新しいAI動画編集ソフト「Flow」

MCP標準化期待、Googleガイド公開や実用例登場【続報】

Google提唱のModel Context Protocol (MCP)がAIエージェント連携の標準規格となることへの期待が改めて高まっています。これはMCPに関する続報です。
Google Cloudは、Agent Development Kit (ADK)とMCPを外部サーバーと統合するためのガイドを新たに公開しました。
また、LangChainとBoxの連携による請求書と発注書の自動照合ワークフローでMCPサーバーが活用されるなど、具体的な実用例も出始めています。

Google Cloud Tech: (翻訳) エンタープライズデータやパブリックツールを活用できる高度なエージェントを構築・展開していますか？外部サーバーとのGoogle ADKおよびMCP統合に関するガイドをご覧ください↓ https://t.co/oZHRSZ9qk7

からあげ: イベント見てましたが面白かったです > 転職したらMCPサーバーだった件 - Speaker Deck https://t.co/AETe07HwwK

LangChain: (翻訳) 🔄 LangChainによる自動ドキュメントマッチング新しいBoxとの統合チュートリアル！LangChainのAIエージェントツールキットとMCPサーバーを使用して、調達ワークフローにおける請求書と発注書の自動マッチングのためのインテリジェントエージェントを構築します。実装デモを見る 🎥 https://t.co/CZstkt3SHy

OpenAI G.ブロックマン氏も25年はAIエージェントの年 YC企業がAI雇用【続報】

OpenAIのGreg Brockman氏が「2025年はAIエージェントの年になる」と改めて発言し、AIエージェントへの期待が一層高まっています。これは同社のSam Altman氏による以前の予測に続くものです。
この流れを受け、AIエージェントが人間の仕事を代替・支援する未来に関する議論が活発化しています。
具体的な動きとして、著名なアクセラレーターY CombinatorのスタートアップであるFirecrawl社が、AIエージェントを従業員として100万ドルで雇用する計画を発表し、大きな話題となっています。

Greg Brockman: (翻訳) 2025年はエージェントの年だ。

TechCrunch: (翻訳) Y CombinatorのスタートアップFirecrawlが、3体のAIエージェントを従業員として雇用するために100万ドルを支払う準備ができたと発表 | TechCrunch https://t.co/PUdqjsAItA

Chubby♨️: (翻訳) 今年ももう半分が過ぎようとしています。そして、2025年が本当にエージェントの年になるだろうと、ある程度の確信を持って言えるようになりました。大きな「アハ体験」は年初にあり、ManusAIがDeepResearchでまだ何が可能かを示しました。OpenAIのCodexは、

Alibaba Qwen2.5-Omni-7B量子化版とスケーリング則研究

Alibabaが、大規模言語モデル「Qwen2.5-Omni-7B」の量子化モデルをHugging FaceおよびModelScopeで公開しました。
これにより、より少ない計算資源でのモデル利用が可能になり、幅広い環境での活用が期待されます。
また、同社は人間の多様な選好が統一された表現を共有する可能性を示唆する「スケーリング則に従う人間選好モデリング」に関する研究も発表しています。

Qwen: (翻訳) 本日、Qwen2.5-Omni-7Bの量子化モデルをリリースします！ Qwen2.5-Omniコレクションの全モデルはHugging FaceとModelSopeでご覧いただけます。 Hugging Face：https://t.co/OUUSzbYZR4 ModelScope：https://t.co/ZqADPAESAe お楽しみください！ https://t.co/LXpa2GY...

Qwen: (翻訳) タイトル：世界の嗜好のモデリング我々の研究は、人間の嗜好モデリングがスケーリング則に従うことを明らかにし、多様な人間の嗜好が統一された表現を共有する可能性を示唆しています。我々はこのスケーラビリティの可能性を強調するために「世界の嗜好のモデリング」を提案します。

Vaibhav (VB) Srivastav: (翻訳) Qwen 2.5 Omni - @Alibaba_QwenによるGPTQおよびAWQ最適化済みチェックポイントがHugging Faceに登場🔥 https://t.co/DwJ1hyHyBQ

NVIDIA新チップGDDR7搭載か CEO発言も【続報】

NVIDIAが中国市場向けに新たなAIチップを開発中との報道に続き、今回はGDDR7メモリを搭載する可能性が報じられました。【続報】
Jensen Huang CEOはTSMC幹部と会食し、両社の協力関係の強固さを示しました。
また、Huang氏はNVIDIA製半導体の中国市場への不正流出について「証拠はない」と強調しました。

パウロ: 革ジャン、TSMCの幹部たちとディナー両者の協業の強さを示している

パウロ: Nvidia GDDR7のAIチップを中国市場に販売日経アジアより

Bloomberg: (翻訳) Nvidia社のジェンスンフアン最高経営責任者（CEO）は、同社の貿易相手国に自信を示し、同社の貴重な半導体が中国市場に転用された証拠はないと述べた。 https://t.co/vvs7kj18ys

Claude Code Pro版提供間近か ChatGPT o3新版テストも

Anthropicのコーディング支援機能「Claude Code」が、Proプランにも拡大される可能性が浮上しています。「Claude Code Pancakes」という実験名も確認されています。
既報のClaudeシステムプロンプト(24kトークン)流出は、引き続き注目を集めています。
ChatGPTのo3モデルにおいて、新バージョンのABテストが行われている可能性が指摘されており、一部で応答に時間がかかるケースが報告されています。

Tibor Blaho: (翻訳) Claude Codeは、Claude Proプランにも間もなく提供される可能性があります（現在はMaxプランのみで利用可能）。「Claude Code Pancakes」という新しい実験が行われています。「サブスクリプションを使用してClaude Codeにサインインすると、サブスクリプションの使用制限がClaude Codeと共有されます。」 https://t.co/k5cjZ0...

Aadit Sheth: (翻訳) これは文字通りClaudeのシステムプロンプトです：リークされた24,000トークンの内部ロジック https://t.co/mGPFREE0eK

Tibor Blaho: (翻訳) 昨日も何度か同じことがありました。もう一方のモデルは、特殊なUnicode文字の問題に対処するために改良されたo3だと思います。

LLM研究: 幻覚検出、RAG安全性、エージェント脆弱性など新報告

LLMの能力向上や課題解決に向けた学術研究が活発です。
長文動画理解における文脈と詳細の両立、Transformerの効率的な学習法「grokking」の高速化などが報告されています。
安全性に関しては、RAGシステムがLLMの安全性を低下させる可能性や、LLMエージェントのツール選択における脆弱性「ToolHijacker」が指摘されています。
また、LLMの不確実性を直接符号化する「Random-Set LLM」や、C/C++リポジトリの脆弱性評価ベンチマーク「SecRepoBench」など、信頼性向上への取り組みも進んでいます。

Rohan Paul: (翻訳) 長編動画の理解は、グローバルな文脈とローカルな詳細の扱いに苦労します。シーケンス・トゥ・シーケンスの視覚言語モデル（VLM）は文脈の限界に直面し、動画エージェントはシーケンシャルです。MR. VideoはMapReduceの原則を適用します。短いクリップを独立して知覚し（Map）、その後集約します https://t.co/02ObqnLJ9O

Rohan Paul: (翻訳) この論文は、RAGがLLMをより安全でなくする可能性があることを示しています。Llama-3-8Bの安全でない応答は0.3%から9.2%に増加しました。安全なモデルとドキュメントを使用した場合でも、これらの新しい脆弱性を分析しています。この論文で検討された方法🔧：→ 11のLLMが5,000を超える有害な質問でテストされました。 https://t.co/nGwUNyULPl

Rohan Paul: (翻訳) LLMエージェントのツール選択は脆弱です。攻撃者はこのプロセスを操作できます。この論文ではToolHijackerを紹介します。ToolHijackerは悪意のあるツール文書を作成します。これらの文書により、エージェントはターゲットタスクに対して攻撃者のツールを選択するようになります。この論文で検討された方法🔧： https://t.co/7flTsFpCCo