2025年08月10日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

GPT-5とGPT-4o共存時代へ:AIの評価軸が変化

OpenAIのGPT-5が全ユーザーへのロールアウトを完了した一方、ユーザーからの要望によりGPT-4oが正式に復活しました。これはAIの評価軸が単なる性能から個性や対話の質へと広がりつつある象徴的な出来事です。

同時に、NVIDIAの中国向けチップH20の輸出ライセンス取得、Google DeepMindの新研究発表、Microsoftの3Dオブジェクト生成機能など、AI業界の動きが加速しています。

それでは各トピックの詳細を見ていきましょう。

目次

  1. GPT-5、全ユーザーへの公開完了も性能評価は賛否両論
  2. 【続報】GPT-4oが正式に復活、AI評価軸は性能から個性へ
  3. NVIDIA、中国向けAIチップH20の輸出ライセンスを正式取得【続報】
  4. 【続報】Grok、PDF読解強化や新モデル登場を予告
  5. Google、インド向け新プランやAI研究で多角展開
  6. Microsoft、Copilotで画像から3Dオブジェクト生成機能
  7. 【続報】Cursor、デフォルトAIをGPT-5に変更と報道
  8. Qwen Code、1日2000クエリの無料枠を提供開始
  9. MCPにUI生成プロトコル「MCP UI」が登場

GPT-5、全ユーザーへの公開完了も性能評価は賛否両論

  • 先日からお伝えしているOpenAIの次期モデルGPT-5の続報です。この度、全ユーザーへのロールアウトが完了しました。
  • 性能については賛否両論で、フロントエンド開発など特定のタスクでは高い能力を示す一方、一部ベンチマークでは期待外れのスコアも報告されています。
  • モデルを自動選択するルーター機能の不安定さに加え、前モデルGPT-4oが持っていた対話の個性や創造性を惜しむ声も多く、性能だけではないユーザーの多様なニーズが浮き彫りになっています。
Bloomberg: (翻訳) OpenAIのCEOであるサム・アルトマンは数ヶ月にわたり、GPT-5の能力を宣伝し、そのローンチを同社にとって画期的な瞬間として位置づけてきた。しかし、リリース後24時間で、この新モデルは賛否両論の評価を受けた。

Romain Huet: (翻訳) GPT-5はフロントエンド開発において驚くほど優れています。ここに、手作業でコードを書くことなく、単一のGPT-5プロンプトで完全に生成された、数十の美しいデモアプリケーションのギャラリーがあります!✨

Chubby♨️: (翻訳) GPT-5はSimpleBenchで56.7%しか達成できず、5位にとどまっています。

【続報】GPT-4oが正式に復活、AI評価軸は性能から個性へ

  • 先日のAMAでの発表通り、GPT-5リリース後に利用できなくなっていたGPT-4oが正式に復活しました。
  • 背景には、性能面で課題が指摘されるGPT-5よりも、GPT-4oの「個性」や「親しみやすさ」を評価するユーザーの声が多数ありました。
  • OpenAIのSam Altman氏もこの点を認め、今後はよりパーソナライズされた機能の強化を進める方針です。
  • AIモデルの評価軸が、単なる性能からユーザー体験や対話の質へと広がりつつあることを示す象徴的な出来事と言えます。
TechCrunch: (翻訳) サム・アルトマン、GPT-5の「順調でない」展開に対応し、4oを復活させ、「チャート犯罪」について語る | TechCrunch

まつにぃ: さらに加えてサムアルトマンから 1. 4oとの会話が想像以上に人気であり、GPT5の様な性能だけが重視されているわけではなかった。 2. ユーザーによって、求める機能は全然違い、より個人特化のカスタマイズに必要性を感じた 3. 長期的により性格、機能含めパーソナライズできる機能を強化して行く。

Forbes: (翻訳) 「あまりにも突然だった」:ChatGPTユーザーはGPT-5の前任者の喪失を悼んだ

NVIDIA、中国向けAIチップH20の輸出ライセンスを正式取得【続報】

  • 先日お伝えしたNVIDIAの中国向けAIチップ「H20」に関する続報です。
  • 米商務省がNVIDIAに対し、同チップの輸出ライセンスを正式に発行したと報じられました。
  • 報道によると、NVIDIAはすでにTSMCにH20のウェハを発注済みで、サプライチェーンの再構築が進められているとのことです。
Financial Times: (翻訳) CEOがトランプと会談後、米国はNvidiaに中国へのチップ輸出を許可

パウロ: Nvidiaホルダーに朗報 H20 中国ヘの出荷許可 正式発行 https://t.co/Eg6vyWKwSd

パウロ: NvidiaはTSMCにH20のウェハを発注済み Q3にH20サプライチェーンの再構成 うおおおおお

【続報】Grok、PDF読解強化や新モデル登場を予告

  • xAIのGrokに、長文PDFの読解能力を向上させる大幅なアップグレードが実装された模様です。数百ページのファイルも扱えるようになり、必要に応じて内容を再取得するBrowseツールも搭載されています。
  • また、画像生成機能「Imagine」の利用上限が倍増されたほか、iOSアプリも好調で、複数の国で生産性カテゴリの上位にランクインしています。
  • 近く「Grok 4.20」や「Grok 4 Code」といった新モデルの登場も噂されており、開発が活発化しています。
Tech Dev Notes: (翻訳) xAIがPDFのアップグレードを展開中 Grokは長いPDFファイルを処理し、コンテンツをより良く認識できるようになります

Tech Dev Notes: (翻訳) xAIはSuperGrokユーザー向けにGrok Imagineの上限を2倍にしました

TestingCatalog News 🗞: (翻訳) リマインダー:Grok 4.20はAGIベータになります👀

Google、インド向け新プランやAI研究で多角展開

  • インド市場向けに、大幅な割引を適用した新AIプラン「Helium」を準備中と報じられました。OpenAIの同市場向けプランに対抗する動きとみられています。
  • Google DeepMindは世界シミュレーター「Genie 3」や地理空間モデル「AlphaEarth」などを次々と発表し、その開発ペースの速さが注目されています。
  • Kaggleでは、Googleの自動MLエンジニアリングエージェント「MLE-STAR」が、ベンチマークタスクの63.6%でメダルを獲得し、研究成果を着実に示しました。
TestingCatalog News 🗞: (翻訳) Googleは、大幅な割引が付いたインド向けの新しい「Helium」Google AIプランを準備しています。以前、OpenAIもインド向けのChatGPT Goプランの開発を開始しました。競争の激しいAI環境👀

Rohan Paul: (翻訳) 🔥 @GoogleDeepMindは減速していません。

Kol Tregaskes: (翻訳) Googleの「自己改善型」MLE-STARは、MLエンジニアリングを自動化し、ベンチマークKaggleタスクの63.6%でメダルを獲得しています。 - ウェブ検索を使用してタスク固有のモデルを取得し、スコアが上昇しなくなるまで最も重要なコードブロックを書き換え続けます。人間の調整は不要です。 - 組み合わせます

Microsoft、Copilotで画像から3Dオブジェクト生成機能

  • MicrosoftのCopilotに、画像から3Dオブジェクトを生成する新機能「Copilot 3D」がLabsで展開され始めた。
  • この機能により、ユーザーは画像をアップロードするだけで、手軽に3Dモデルを作成できるようになる。
  • AIによるコンテンツ生成が2Dから3Dへと広がる中で、今後の活用が期待される。
TestingCatalog News 🗞: (翻訳) Copilot 3DがLabsで展開中です!🧪 そちらでは、ユーザーはアップロードした画像から3Dオブジェクトを生成できます。

【続報】Cursor、デフォルトAIをGPT-5に変更と報道

  • 以前からGPT-5の搭載が噂されていたAIコーディング支援ツール「Cursor」の続報です。デフォルトで使用するAIモデルが、AnthropicのClaudeからOpenAIのGPT-5に変更されたと報じられました。
  • この変更は、先日リークされたGPT-5の優れたコーディング性能を裏付ける動きと見られています。
  • 開発者向けAIツール市場における、OpenAIとAnthropicの競争がさらに激化しそうです。
Rohan Paul: (翻訳) CursorがデフォルトモデルとしてAnthropicではなくOAIを選択。これは大きな変化であり、Anthropicがコーディングを少し改善するClaudeのアップデートをリリースした理由の一部を説明しています。--- 出典:theverge

Qwen Code、1日2000クエリの無料枠を提供開始

  • Alibaba CloudのAIコーディングアシスタント「Qwen Code」が、1日2000クエリまで無料で利用できるキャンペーンを開始した。
  • 簡単なコマンドを実行するだけで利用開始でき、個人利用であれば多くのタスクを無料で試すことが可能になる。
  • 開発者向けツールの競争が激化する中、ユーザー獲得に向けた積極的な施策として注目される。
まつにぃ: Qwen Codeで毎日2000クエリが無力枠と実質無料キャンペーンみたいな施策を打ち出したQwen。 個人利用で無料でのお試しだけなら大体全部これで済むかもしれません。 💡 毎日2,000回の無料Qwenコード実行が得られます! 以下コマンドで完結 npx @​qwen-code/qwen-code@latest

Iaiso: Qwen Codeからhttps://t.co/9boDBARxpL アカウトに接続すると1日2000リクエスト無料で使えるようにしたみたいだ。たしかにそうしないとGimini CLIと比較してもらえないからなぁ

MCPにUI生成プロトコル「MCP UI」が登場

  • AIエージェントの連携プロトコル「MCP」の新たな展開として、UI生成に特化した「MCP UI」が提唱され、話題になっています。
  • AIがテキスト応答だけでなく、ボタンやフォームといったインタラクティブなUIを直接ユーザーに提示できるようにするプロトコルです。
  • 実現すれば、AIが提供する体験がよりリッチで直感的になり、アプリケーションの操作性が大きく向上する可能性があります。
azukiazusa: AI エージェントがインタラクティブな UI を返すことを可能にする MCP UI https://t.co/8tDPIfhXAr

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください