2025年06月06日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

最新AIモデル対決:Gemini 2.5 Pro首位、Claude自己進化、新音声技術の進展

AIモデル競争が新たな局面を迎えています。Google「Gemini 2.5 Pro」がAI Arenaで総合1位を獲得し、特にコーディングや多言語対応で高評価を得ています。

一方、AnthropicのClaude Codeは自身の開発の90%以上を自ら行う自己進化能力を示し、OpenAIはChatGPT音声v2のロールアウトを開始。ElevenLabsも70言語対応の新TTS「Eleven v3」を発表し、AI音声技術の進化が加速しています。

企業動向では、Perplexity AIがMemory機能を全ユーザーに提供開始し、Amazonは人型ロボット開発のための研究グループを新設。AI技術の応用範囲が急速に広がっています。

それでは各トピックの詳細についてご覧いただきましょう。

目次

  1. Gemini 2.5 Pro(6/5版) AI Arena総合1位獲得【続報】
  2. Claude続報: Code自己進化、Projects強化、Govモデルも
  3. OpenAI新情報: ChatGPT音声v2、o3 Pro等のUI確認、データ保存命令も
  4. Cursor 1.0、APIキー送信仕様やフリーズ問題が報告【続報】
  5. ElevenLabs続報: 新TTS v3発表 多言語・感情表現強化
  6. Perplexity AI、Memory機能提供開始 7.8億クエリ達成 大型資金調達も【続報】
  7. Figma公式MCP提供開始、AI連携強化と活用拡大へ【続報】
  8. 【続報】AIと雇用 Google CEOがUHIの必要性を示唆
  9. Amazon 人型ロボット開発強化、AIエージェント研究G新設【続報】
  10. X、AI学習へのコンテンツ利用を規約で禁止

Gemini 2.5 Pro(6/5版) AI Arena総合1位獲得【続報】

  • Googleの最新大規模言語モデル「Gemini 2.5 Pro」の2025年6月5日アップデート版に関する続報です。同モデルがAI Arenaの各種ベンチマークでOpenAIのGPT-4oやAnthropicのClaude 3 Opusを上回り、総合1位を獲得したと複数の開発者や研究者から報告されています。
  • 特にコーディング、数学、科学、多言語、長文クエリなどの分野で高い性能を示し、LMArena Eloスコアにおいて前バージョンから+24ポイントの大幅な向上が確認されました。
  • 開発者からは「驚異的」「全ての分野でNo.1」といった絶賛の声が上がっており、Google DeepMindの成果として注目されています。
  • ただし、一部ユーザーからは最新モデルへのアクセスが制限されていることへの言及もあります。
Rohan Paul: (翻訳) 🚨速報:新しいGemini-2.5-Pro(06-05)が再び全アリーナで1位を獲得! 🥇テキスト、ビジョン、WebDevで1位 🥇ハード、コーディング、数学、クリエイティブ、マルチターン、指示追従、ロングクエリカテゴリで1位 Google DeepMindおめでとうございます! https://t.co/gYYjkuJsX4

Chubby♨️: (翻訳) Googleは自己を超え、現在1位と2位の両方を占め、全アリーナで1位を獲得しています。 https://t.co/r86j0CfiiY

Oriol Vinyals: (翻訳) 新しいGemini 2.5 Proプレビュー版をご紹介します。前身モデルからLMArena Eloスコアが+24向上しました!📈 難易度の高いコーディング(AIME、AIDER)、科学(GPQA)、推論(HLE)でリードしています。皆様のフィードバックのおかげでスタイルや構造も改善されました。詳細はこちら:https://t.co/FFhQ1wFK5e https://t.co/N3H...

Claude続報: Code自己進化、Projects強化、Govモデルも

  • AnthropicのClaudeシリーズに関する続報です。
  • コーディング支援AI「Claude Code」は、その開発の90%以上を自身で行ったと報告され、自己進化能力を示しました。
  • 「Projects on Claude」では、扱えるコンテキストウィンドウが実質10倍に拡張され、より大量の情報を処理可能になりました。
  • 米国の国家安全保障顧客向けに、機密環境で運用されるカスタムAIモデル群「Claude Gov」の提供が開始されました。
Alex Albert: (翻訳) Claude Codeは、市場のどのツールよりもプログラミングの未来を最もよく垣間見せてくれます。

Rohan Paul: (翻訳) Claudeのプロジェクトが10倍多くのコンテンツをサポートするようになりました。既存のしきい値を超えるファイルを追加すると、Claudeは新しい検索モードに切り替わり、機能的なコンテキストを拡張します。 https://t.co/8ob8QHluT5

TechCrunch: (翻訳) Anthropic、米国の国家安全保障顧客向けカスタムAIモデルを発表 | TechCrunch https://t.co/Bpy9WxjIOs

OpenAI新情報: ChatGPT音声v2、o3 Pro等のUI確認、データ保存命令も

  • ChatGPTの音声モデル(AVM)のバージョン2がロールアウトされ始めている可能性が示唆されており、音質向上が期待されます。
  • 既報の「o3 Pro」モデルに加え、「Alpha Models」「experiment models」といった未リリースモデルの表記が一部ユーザーのUIで確認され、新モデルへの期待がさらに高まっています。
  • ChatGPTの出力には目に見えないウォーターマーク(電子透かし)が埋め込まれているとの報告が上がっています。
  • 著作権訴訟に関連して、OpenAIがChatGPTの全利用データを永久保存するよう裁判所命令を受けたことが明らかになり、プライバシーに関する懸念も出ています。
Chubby♨️: (翻訳) ChatGPTのAVMはずっと改善されたように聞こえます。

Chubby♨️: (翻訳) この時点では、彼らは私たちをからかっているだけです。 - モデルセレクターのo3 pro - 「Alpha Models」 - 「experiment models」 https://t.co/xeEFjWV8gO

Chubby♨️: (翻訳) OpenAIは、著作権訴訟の一環としてすべてのChatGPT利用データを保存するよう命じた裁判所命令を「プライバシーの悪夢」と表現しています。同社は、このデータが実際に証拠として使用されるかどうか不明であるにもかかわらず、大量の機密ユーザーデータをアーカイブせざるを得ないと感じています。 https://t.co/8GLJWeM0OW

Cursor 1.0、APIキー送信仕様やフリーズ問題が報告【続報】

  • 先日リリースされたAI搭載コードエディタCursor 1.0に関し、ユーザーから複数のフィードバックや問題点が報告されています。
  • APIキーがリクエスト毎にCursorのサーバーへ送信される仕様であることや、User Rules機能がログイン後にしか表示されずサーバーサイドで管理されている可能性が指摘されています。
  • また、一部ユーザーからはBusinessプランで新機能の多くが有効化できないとの声や、ターミナルコマンド実行後にフリーズする問題も報告されています。
  • これらの課題に対し、今後の改善が期待されます。
Wolfram Ravenwolf: (翻訳) 本当に、本当にこの1.0リリースを祝いたいです!でも、ユーザー規則はどうなっているのですか?(秘密裏に)サーバー側になったのですか?この機能はログイン後にしか表示されず、「後でもう一度試してください」というのはローカルストレージのようには聞こえません!👀 https://t.co/pw8k6pWGm3

てつ / AI Man: Cursor 1.0 の機能が Business プランではほぼ有効化できない機能ばかりで泣いている

Ian Nuttall: (翻訳) ターミナルコマンドの後、Cursorが固まったりしますか?文字通り、スキップをクリックするまで何も起こりませんが、コマンドは完了しました。もしあなたにもこれが起こるなら、下に返信してください。これが私だけなのか知りたいです(気が狂いそうです!)😳 https://t.co/nFMya3btXn

ElevenLabs続報: 新TTS v3発表 多言語・感情表現強化

  • ElevenLabsからの音声AIに関する続報です。同社が、これまでで最も表現力豊かとされるテキスト読み上げ(TTS)モデル「Eleven v3 (alpha)」を発表しました。
  • この新モデルは70以上の言語に対応し、複数話者による対話や、[excited]、[sighs]、[laughing]、[whispers]といったオーディオタグによる感情表現も可能です。
  • 開発者からは「AI音声の転換点」「息をのむほどのスピードでロボットが進化している」など、その高い表現力と将来性について驚きの声が上がっています。
Chubby♨️: (翻訳) Eleven v3 (alpha) をご紹介します - これまでで最も表現力豊かなテキスト読み上げモデルです。70以上の言語、複数話者の対話、[興奮して]、[ため息をついて]、[笑いながら]、[ささやき声で]などのオーディオタグをサポートしています。現在パブリックアルファ版で、6月中は80%オフです。 https://t.co/n56BersdUc

Rohan Paul: (翻訳) 声優は死んだ。これはエリートの声優を殺すわけではないが、その下の仕事の95%を殺す。ElevenLabsのこの結果は本当に転換点だ。本物の声優はプロンプトエンジニアリングを学び始めるべきだ。

Caleb: (翻訳) これはすごい!

Perplexity AI、Memory機能提供開始 7.8億クエリ達成 大型資金調達も【続報】

  • AI検索エンジンPerplexity AIが新機能「Memory」を全ユーザーに提供開始しました。これは以前報じられた開発中のメモリ機能の正式リリースとなります。
  • これにより、過去の検索履歴や設定を記憶し、よりパーソナライズされた検索体験が可能になります。
  • 同社は先月7億8000万件のクエリを処理したとCEOが明らかにしており、急成長を続けています。
  • また、メディア大手Cox Enterprisesなどから14億ドルの評価額で大型資金調達の交渉中であると報じられており、AI検索分野での競争激化が予想されます。
TestingCatalog News 🗞: (翻訳) PerplexityにMemory機能が搭載されました!🔥 https://t.co/TfbMv6SrqF

TechCrunch: (翻訳) PerplexityのCEOによると、先月7億8000万件のクエリを受信 | TechCrunch https://t.co/mvNXHqO9BD

The Information: (翻訳) AI検索スタートアップのhttps://t.co/p6UfSlX6R2が、メディアコングロマリットのCox Enterprisesと14億ドルの評価額で資金調達交渉中です。この潜在的な資金調達ラウンドについて詳しくはこちら:https://t.co/wML6CjDGd7 #aifunding

Figma公式MCP提供開始、AI連携強化と活用拡大へ【続報】

  • デザインツールFigmaのAI連携プロトコル「MCP」に関する続報です。
  • Figmaが公式のMCP提供を開始し、ローカルサーバーを介してデザインのサンプルコードや画像を取得する仕組みが利用可能になりました。
  • この公式MCPにより、サードパーティ製よりもシンプルな連携が期待され、開発者の間で具体的な活用が広がっています。
てつ / AI Man: Figma MCP 将来的にはリモート MCP サーバーにも対応するらしい!さすが公式! > features like remote server capabilities and deeper codebase https://t.co/x4bmvuHvwR

Publickey: ブログ書きました: WindowsがMCPをサポート/WSLがオープンソースに/AWSのシェアがついに30%を切る、ほか。2025年5月の人気記事 https://t.co/wmZf4LpnB9

てつ / AI Man: Cursor がいつのまにかリモート MCP サーバー対応していた! ※ ページに記載のもの全てがリモート MCP サーバーではない Notion MCP に関しては特に企業だと API キー発行してもらわないと MCP 使えなかったけど Notion へのログインで MCP 使えるようになったので便利そう https://t.co/L5m8VEGVzK

【続報】AIと雇用 Google CEOがUHIの必要性を示唆

  • AIの進化に伴う雇用への影響について、議論が続いています。
  • Google DeepMindのCEOデミス・ハサビス氏は、AIによる生産性向上を分配するために「ユニバーサル・ハイ・インカム(UHI)」のような制度が5〜10年スパンで必要になる可能性を示唆しました。
  • 一方で、AIによる雇用喪失への懸念に対し、「AIを早期導入するか、ブルーカラースキルを習得することがシンプルな対応策」との意見や、AIが人間の仕事を完全に代替するまでにはまだ時間がかかるとの現実的な見方も出ています。
  • AIと雇用の関係については、引き続き政治的な議論も活発化しており、適切な政策の必要性が叫ばれています。
Chubby♨️: (翻訳) https://t.co/W7otSziBSG Google DeepMind CEO デミス・ハサビス氏:5~10年後には、ユニバーサル・ハイ・インカムのようなものが必要になるでしょう。彼らはAIが世界経済にどれほど大きな混乱をもたらすかを知っており、それが来ると知っています。

Bindu Reddy: (翻訳) パニックにならないで - 大量解雇に関する集団ヒステリーが突然現実味を帯びてきました。パニックになる理由はありません。AIをできるだけ早く導入するか、お気に入りのブルーカラーのスキルや専門職を習得するだけです。正直なところ、それだけ単純なことです。

Anton Leicht: (翻訳) 新投稿 - AIの仕事:政策なき政治 AIと仕事について「何かをする」という政治的機運が高まっています。これは有望な窓ですが、現在、政治的に実行可能な政策がありません。その後の議論は非常に悪い方向に向かう可能性があります。🧵 https://t.co/Gt5rXlemjP

Amazon 人型ロボット開発強化、AIエージェント研究G新設【続報】

  • Amazonが、エージェントAIとロボティクスに特化した新たな研究開発グループを設立したとの続報です。
  • これは、以前報じられた荷物配送用人型ロボットのテスト準備と関連する動きと考えられます。
  • 新グループは、ロボットがより自律的にタスクを実行できるよう、AIエージェント技術の開発に注力する見込みです。
  • 将来的には、倉庫作業の自動化やラストワンマイル配送など、Amazonのオペレーション全体を変革する可能性が期待されます。
TechCrunch: (翻訳) Amazon、エージェントAIとロボティクスに特化した新しい研究開発グループを立ち上げ | TechCrunch https://t.co/0xYK4GzgQr

The Information: (翻訳) AIアジェンダ:Amazonの人型ロボットの背後にある中国の技術 Amazonの人型配送ロボット開発には、中国製のハードウェアとソフトウェアが使用される可能性があり、これはロボット工学における中国の台頭の兆候です。 @rocketalignment の詳細はこちら👇 https://t.co/nh0xsWXKt5

The Information: (翻訳) 応用AI:ロウズがOpenAI搭載音声アシスタントを店舗フロアに導入 ロウズはOpenAIモデルを使用して、店舗従業員を支援するAI音声アプリを作成しました。 @jon_victor_ の詳細はこちら👇 https://t.co/miMVCa3eM7

X、AI学習へのコンテンツ利用を規約で禁止

  • X(旧Twitter)が利用規約を更新し、AIモデルの訓練にXのコンテンツを使用することを明示的に禁止しました。
  • この変更は、AI開発企業によるウェブコンテンツのスクレイピングやデータ利用に関する議論が活発化する中で行われました。
  • 多くのプラットフォームがAI学習データの権利関係や利用許諾について模索する中、Xのこの動きは今後のAI開発におけるデータ収集のあり方に影響を与える可能性があります。
TechCrunch: (翻訳) X、AIモデルの訓練に自社コンテンツの使用を禁止する規約変更 | TechCrunch https://t.co/EPkCzEtyj0

Rohan Paul: (翻訳) AIがすべてを偽造するようになると、検証する者が新たな「真実」の最も重要な門番となる。VeoビデオのウォーターマークやSynthIDによるディープフェイク検出などを考えよ。 https://t.co/QT3hjwwUL8

Kenn Ejima: AIモデルの戦いはGithub上へと移った https://t.co/ipYQ40N9TW

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください