2025年09月11日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

開発者向け機能拡充とAI市場の急成長

今週のAI業界では、開発者エコシステムの強化が目立ちました。ChatGPTの開発者モードでカスタムMCP連携が可能になり、ReplitがAgent 3で開発の自律性を10倍向上させました。

また、ForbesのCloud 100ではAI企業が牽引し総評価額が1兆ドルを突破。Claudeの複雑な財務モデル自動生成やKaggleの新ベンチマークなど、AIの実用性と信頼性向上も進んでいます。

それでは各トピックの詳細に進みましょう。

目次

  1. ChatGPT、開発者モードでカスタムMCPをサポート【続報】
  2. Replit、自律性を10倍高めたAIエージェント「Agent 3」発表
  3. 【続報】AmazonのZoox、ラスベガスで無料ロボタクシー開始
  4. Mira Murati氏の新会社、研究ブログを公開【続報】
  5. ClaudeのExcel生成、複雑な財務モデルも自動作成可
  6. Gemini CLI、デプロイや脆弱性分析に対応【続報】
  7. Kaggle、LLMの事実性を測る新ベンチマークSimpleQA公開
  8. NVIDIA、HBM3eの15%値下げをメモリメーカーに要求か
  9. Forbes Cloud 100、AI企業が牽引し総評価額1兆ドル突破

ChatGPT、開発者モードでカスタムMCPをサポート【続報】

  • 以前より報じられていた、MCP(Model Context Protocol)を活用した外部サービス連携機能の続報です。
  • 今回、新たに「開発者モード」がベータ版として展開され、未検証のコネクタを含むカスタムMCPの利用が正式にサポートされるようになりました。
  • これにより、Jiraチケットの更新やZapierワークフローのトリガーなど、より柔軟な自動化や連携が可能になります。
TestingCatalog News 🗞: (翻訳) OpenAIはChatGPTのベータ版で「開発者モード」を展開し、ユーザーが未検証のコネクタを有効にできるようにしました。「データを永久に変更または消去する可能性のある未検証のコネクタを追加できます。」自己責任でご利用ください 🤖

TestingCatalog News 🗞: (翻訳) ChatGPTが(ついに)カスタムMCPをサポートしました!設定の新しい開発モードのトグルを介して、さまざまなMCPを接続できます。

まつにぃ: 一度取り消したGPTのMCP接続やっと行ったか?? さて繋いでみるか。

Replit、自律性を10倍高めたAIエージェント「Agent 3」発表

  • オンラインIDEを提供するReplitが、ソフトウェア開発の自律性を大幅に向上させた新しいAIエージェント「Agent 3」を発表しました。
  • Agent 2と比較して10倍自律的であり、テスト、デバッグ、リファクタリングを自動化する機能を備えています。
  • 200分以上の自律実行が可能で、その進捗はスマートフォンからライブモニタリングできるなど、より複雑な開発タスクの自動化が期待されます。
Kol Tregaskes: (翻訳) Replitは、ソフトウェア開発においてV2よりも10倍自律的なAgent 3をリリースしました。主要なモデルよりも3倍高速で10倍安価な独自のシステムで、テスト、デバッグ、リファクタリングを自動化します。Agent 3は複雑なビルドを処理し、エラーを修正します。

Chubby♨️: (翻訳) Agent 3は10倍自律的です。ついに約束されていた「Devin」を手に入れることができるのでしょうか?

Chubby♨️: (翻訳) これは最も重要な指数関数的な発展です。

【続報】AmazonのZoox、ラスベガスで無料ロボタクシー開始

  • 先日、ハンドルなし車両の公道走行許可取得をお伝えしたAmazon傘下のZooxの続報です。
  • 同社はラスベガスで、一般向けの無料ロボタクシーサービスを正式に開始しました。
  • ハンドルやペダルのない専用設計の車両によるサービスは米国初となります。
  • これにより、Waymoなどとの競争が本格化し、自動運転タクシー市場の拡大が期待されます。
Forbes: (翻訳) Waymo、ついにロボタクシーの競合登場 AmazonのZooxがラスベガスでサービス開始

Bloomberg (@business): (翻訳) Amazonの自動運転部門であるZooxは、ラスベガスで一般向けの乗車サービスを開始しました。これは、運転制御装置のない専用設計のロボタクシーとしては米国初となります。

Forbes: (翻訳) Amazonのロボタクシー部門は、ラスベガスの複数の指定場所から、当面は無料で一般向けの乗車サービスを開始しました。ハンドル、ペダル、従来の制御装置がないことが、AlphabetのWaymoの車両との違いとなる可能性があります。

Mira Murati氏の新会社、研究ブログを公開【続報】

  • 元OpenAI CTO、Mira Murati氏が率いる新興企業「Thinking Machines Lab」に関する続報です。
  • 同社は研究ブログ「Connectionism」を立ち上げ、最初の投稿として「LLM推論における非決定性の克服」と題した記事を公開しました。
  • 「科学は共有されることでより良くなる」という理念を掲げており、AI研究コミュニティから大きな注目を集めています。
Lilian Weng: (翻訳) コネクショニズムがAI分野の初期と関連があり、ニューラルネットワークと人間の脳の類似性を浮き彫りにするという面白い事実に加えて、(最初の)Thinking Machinesの主力製品はコネクションマシンと名付けられています。— 🧑‍🎓読書を楽しんでください。続報をお楽しみに!

clem 🤗: (翻訳) 「科学は共有されることでより良くなる」🔥🔥🔥

Tanishq Mathew Abraham, Ph.D.: (翻訳) よー、これを待ってたんだ!シンキング・マシーンズの初投稿だ!すごく良さそう...

ClaudeのExcel生成、複雑な財務モデルも自動作成可

  • 先日お伝えした、AnthropicのClaudeがファイルを直接生成する機能の具体的な活用事例が話題です。
  • 簡単な指示で、複雑な財務モデル(割引キャッシュフローモデル)を含むExcelワークブックを数式付きで一度に生成できます。
  • これまで専門知識がなければ作成困難だった資料をAIが自動生成できる可能性を示しており、金融分野などでのAI活用をさらに一歩進めるものとして期待されています。
Alex Albert: (翻訳) 「クロード、割引キャッシュフローの財務モデルを作って。間違いのないように。」これまで財務モデルなんて作ったことなかったけど、クロードが一発で数式完備の9シートのワークブックを作ってくれた。Vibe Excel時代だね。

Gemini CLI、デプロイや脆弱性分析に対応【続報】

  • Googleのコマンドラインツール「Gemini CLI」に関する続報です。
  • 新たに追加された「/deploy」コマンドでCloud Runへの直接デプロイ、「/security:analyze」コマンドでコードの脆弱性分析が可能になりました。
  • これにより、開発者はコマンドラインから離れることなく、アプリケーションのデプロイとセキュリティチェックをシームレスに行えるようになります。
Google Cloud Tech: (翻訳) 2つの新しいGemini CLI拡張機能で、アイデアから本番環境への移行をより迅速かつ安全に ⚡ 1️⃣ /deploy アプリをCloud Runに直接デプロイ 2️⃣ /security:analyze コードの脆弱性を分析 コマンドラインからワークフローを強化 → https://t.co/6JoKTlU3nA https://t.co/b880X9Vyjm

ML_Bear: Google謹製のGeminiだからこそ出来る内容が増えてきた。これは期待大ですね😇 「/deploy コマンドを使用すると、Cloud Run MCPサーバー を利用したコマンドライン操作で、Webアプリケーションやクラウドサービスの完全なCI/CDパイプラインを自動化できます」 https://t.co/vRfKoZb8Qz

まつにぃ: GeminiCLI経由のcloud run デプロイ! 拡張機能ね。 CLIのデプロイ拡張機能周りもリッチになりそうですね。 Googleはエコシステムあるのでこの辺は流石に強い。 早くGemini強くなれ!

Kaggle、LLMの事実性を測る新ベンチマークSimpleQA公開

  • KaggleはGoogle DeepMindおよびGoogle Researchと協力し、LLMの短文形式での事実性を評価するための新しいベンチマーク「SimpleQA Verified」を公開しました。
  • このベンチマークは、専門家によってキュレーションされた1,000個のプロンプトから構成されています。
  • より信頼性が高く挑戦的な評価を通じて、LLMの事実性の向上に貢献することが期待されます。
Kaggle: (翻訳) 🚀 新しいベンチマークの発表:SimpleQA Verified! Google DeepMindおよびGoogle Researchと提携し、LLMの短文形式の事実性について、より信頼性が高く挑戦的な評価を提供するために設計された、キュレーション済みの1,000プロンプトのベンチマークを立ち上げました。リーダーボードはこちらでご確認ください:https://t.co/Ml1tMvxb...

NVIDIA、HBM3eの15%値下げをメモリメーカーに要求か

  • これまで供給逼迫による価格高騰が報じられてきたHBMメモリについて、逆の動きが報じられました。
  • NVIDIAがHBM3eメモリについて、2025年第4四半期からの15%価格引き下げをメモリメーカーと交渉しているとのことです。
  • 一方で、NVIDIAは次世代のHBM4に対してはデータ転送レートの引き上げを要求しており、AI半導体を巡る交渉は複雑化しています。
  • 需要が旺盛なためSK Hynixなどは値下げに難色を示しているとの観測もあり、今後の動向が注目されます。
Jukan: (翻訳) MUのファンボーイたちが私の言っていることは単なるFUDだと主張したとき、どれほど傷ついたか、あなたにはわからないでしょう。NVIDIAはHBMメーカーにHBM4の速度を上げるよう、さらに強く働きかけています。詳細は私の購読者向けノートにあります。

パウロ: Nvidia 「HBM3E 12Hi 15%安く」 SK Hynix 「嫌です」 Broadcom 「HBM3E 12Hi 買います。OpenAIの分、Jericho 4AIの分追加します」 SK Hynix 「売ります」 こんな感じ

パウロ: HBM3E 12Hiは他にも欲しいメーカーがたくさんいるから値下げ無理でしょうね OpenAIで受給がやばくなった

Forbes Cloud 100、AI企業が牽引し総評価額1兆ドル突破

  • Forbesが発表した2025年版「Cloud 100」レポートによると、主要な非公開クラウド企業100社の総評価額が初めて1兆ドルを突破しました。
  • この成長の主要因はAIであり、総価値の約42%がAIを中核事業とする企業によるものだと報告されています。
  • AI技術がクラウド市場全体の成長を強力に牽引している現状が浮き彫りになりました。
Chubby♨️: (翻訳) フォーブスはクラウド100レポート2025を発表しました。主要な非公開クラウド企業100社の総評価額が初めて1兆ドルを超えました。そしてAIが主要な推進力となっています。この総価値の約42%は、中核事業が人工知能である企業に起因すると考えられます。

Forbes: (翻訳) Forbes Cloud 100リストに初登場したMercorは、求職者を面接するためのAIリクルーターを構築しました。その過程で、同社はより即効性のある資金源を発見しました。それは、AIモデルをトレーニングするための人間を見つけることです。続きを読む:https://t.co/6kKlta3oOV https://t.co/dY36gEJMUE

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください