21 5月 2025

2025年05月21日朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Googleが描くAIの未来：Gemini 2.5から新ハードウェアまで

Google I/Oで発表された一連のAI技術革新が注目を集めています。Gemini 2.5シリーズの登場と「Deep Think」モード、XRメガネや新たな画像・動画生成AI「Veo 3」「Imagen 4」の発表など、多岐にわたる展開が見られました。

一方、OpenAIのChatGPTは過去1年でDAUが4倍増と急成長を続け、xAIはGrokのエンタープライズ版提供と大規模スパコン建設計画を発表しています。AIコーディングエージェント市場でも競争が激化しています。

それでは各トピックの詳細を見ていきましょう。

Google I/O: Gemini大幅進化、2.5世代、新プラン、検索・Chrome統合【続報】
Google I/O: Veo 3・Imagen 4・Flow正式発表【続報】
Google I/O: XRメガネ発表、NotebookLM動画要約機能追加
Google I/O続報: Jules正式発表、新Gemma 3、ADK強化など
ChatGPTのDAU、1年で4倍増とOpenAI CEO発表【続報】
xAI、Grokエンタープライズ版提供へ 100万GPUスパコン続報も
コーディングAgent戦激化 Stability AI元CEO II-Agent公開続報
MS出資の英AI企業Faculty AI 経営破綻/資金難と報道
Perplexity、AIエージェントブラウザ「Comet」早期提供開始
llama.cpp SWA対応 Gemma 3メモリ大幅削減【続報】

Google I/O: Gemini大幅進化、2.5世代、新プラン、検索・Chrome統合【続報】

Google I/OにてAIモデル「Gemini」の大幅アップデートが発表された続報です。
次世代モデル「Gemini 2.5 Flash」「Gemini 2.5 Pro」が登場しました。
高度な推論能力を持つ「Deep Think」モードや最上位プラン「Google AI Ultra」($249.99/月)も発表されました。
Google検索では全米で「AIモード」が展開され「Deep Search」機能も追加されました。
ChromeブラウザにもGeminiが統合されAIアシスタントとして機能します。
Gemini 2.5 FlashはLMSys Chatbot ArenaでGPT-4oに次ぐ高評価を獲得するなど、性能向上が注目されています。

Google Gemini App: (翻訳) 私たちの目標は、Geminiを最もパーソナルで、プロアクティブで、パワフルなAIアシスタントにすることです。すでにアプリと検索履歴を接続できるようになっており、まもなく、あなたの許可を得て、Google全体からさらに多くの個人的なコンテキストをGeminiに追加できるようになります。

Logan Kilpatrick: (翻訳) Google検索のAIモードが、本日より米国の全ユーザーに展開開始されます :) これは、皆さんがご存知の検索体験をAI時代に合わせて再構築したもので、「ディープサーチ」という新機能も含まれています！

Yi Tay: (翻訳) もう終わりだ。Gemini 2.5 flashは（2.5 proを除いて）他のすべてを打ち負かした。😎 Googleに戻ってまだ5ヶ月だけど、@quocleixと@vqctran（そして他の数人）と一緒に、とんでもない研究アイデア（話せないけど😶）をこのモデルに投入したんだ。🔥

Google I/O: Veo 3・Imagen 4・Flow正式発表【続報】

Google I/Oにて、既報のマルチモーダルAI関連の発表が正式に行われました。【続報】
音声付き動画生成AI「Veo 3」は、セリフや効果音、BGMを含む動画を作成可能です。
画像生成AI「Imagen 4」は、より詳細な描写、豊かな色彩、優れたテキスト出力を実現します。
これらのモデルを活用するAI動画編集ツール「Flow」も発表され、クリエイティブ制作を支援します。
OpenAIのSoraなど競合サービスとの競争が一層激化すると見られます。

Google Gemini App: (翻訳) Imagen 4は、より豊かなディテール、よりニュアンスのある色彩、そしてより優れたテキスト出力で際立つビジュアルを提供します。本日より、どなたでもGeminiアプリで無料で画像を生成できます。

Google Labs: (翻訳) こちらがFlowです。Veoを使った次世代のストーリーテリングがここで始まります。今すぐ作成しましょう。

TestingCatalog News 🗞: (翻訳) 速報🚨: Googleは、動画と音声の同時生成をサポートするAI動画生成モデルの新バージョン「Veo 3」を発表しました！ Veo 3は、米国のGoogle AI Ultra加入者向けにGeminiで本日より利用可能になります。Veo 3のサンプルはこちら👀

Google I/O: XRメガネ発表、NotebookLM動画要約機能追加

Google I/OでAndroid XRプラットフォームを基盤とするメガネが発表されました。AI機能を搭載し、Warby Parkerとの提携も明らかにされています。【続報】
AIノートアプリ「NotebookLM」には、PDFや写真などのソースから短い動画概要を生成する「Video Overviews」機能が追加されました。
NotebookLMのiOS版アプリは米App Storeでトップ10入りするなど好調です。【続報】
これらの発表は、AIを日常生活や作業により深く統合するGoogleの方向性を示しています。

TechCrunch: (翻訳) Google、Android XRベースのメガネを披露、Warby Parkerとの提携を発表 | TechCrunch

NotebookLM: (翻訳) それだけではありません...手短に言うと、オーディオ概要の長さをコントロールできるようになりました（現在は英語のみですが、近日中に他の言語も対応予定です！）。短め（約5分以上）、長め（約20分以上）、デフォルト（約10分以上）の設定で、AIホストがあなたのソースについて議論する深さと長さを完全にカスタマイズしてみてください！

Logan Kilpatrick: (翻訳) @NotebookLM アプリが利用可能になり、すでにApp Storeでトップ10入りしています！！！

Google I/O続報: Jules正式発表、新Gemma 3、ADK強化など

先日お伝えしたGoogle I/Oでの発表に関する続報です。
AIコーディングエージェント「Jules」がGemini 2.5 Proを搭載し、パブリックベータに移行しました。
モバイルオンデバイス向け新モデル「Gemma 3n」のプレビュー版や、LLM生成を高速化する「Gemini Diffusion」も発表されました。
また、Agent Development Kit (ADK)のJava SDKやPython ADK安定版がリリースされ、開発者支援が強化されています。

Kai INUI: あと、ひっそりリリースしてたコンテナ型AIコーディングエージェントのJulesがパブリックベータに。先に試してた海外ニキのポストでは、Codexよりも全体を見たタスクが得意そうな感じだった

Kaggle: (翻訳) #KaggleModels で利用可能になりました！詳細はこちら: (引用: ✨ 本日より早期プレビュー版としてGemma 3nをご紹介します。このモデルは、モバイルのオンデバイス利用に最適化された最先端のアーキテクチャを使用しています。マルチモーダル性、超高速推論などを実現します。)

Daisuke Okanohara / 岡野原大輔: Gemini DiffusionはLLMの生成で拡散モデルを採用し従来の5倍近い生成速度（1500トークン/秒）を実現拡散モデルを採用したLLMは商用モデル（Mercury）や研究（LLaDa等）が登場している。特に途中を修正することが多いコーディングに向いているが、他タスクでも追いつくだろう https://t.co/ICgZKffapr

ChatGPTのDAU、1年で4倍増とOpenAI CEO発表【続報】

OpenAIのCEO、Sam Altman氏がChatGPTのデイリーアクティブユーザー数(DAU)に関する新たな成長を発表しました。
過去1年間でDAUは4倍以上に増加し、1日あたりのメッセージ数もそれ以上に増加しているとのことです。
この成長は、エンジニアリングチームによる信頼性と速度の向上も背景にあるとされています。
AIチャットボット市場におけるOpenAIの強い成長が継続していることを示すものです。

Sam Altman: (翻訳) chatgptのデイリーアクティブユーザーは過去1年で4倍以上に増加しました。1日あたりのメッセージ数はそれよりもはるかに多いです。同時に、エンジニアリングチームは信頼性を大幅に向上させ、現在、速度に関しても真の進歩を遂げています。これを実現するための規模は相当なものです。素晴らしい仕事です！

Nathan Lambert: (翻訳) 今日のI/Oで最も重要なプロット -- AIの利用が急増している。これは現実だ。

xAI、Grokエンタープライズ版提供へ 100万GPUスパコン続報も

xAIに関する続報です。同社がAIモデル「Grok」を企業や政府機関向けに提供する計画が報じられました。
また、Elon Musk氏は以前報じられた100万GPU規模のスーパーコンピューターについて、メンフィス近郊に今後6～9ヶ月で建設する計画を明らかにしました。
xAIのエンタープライズ市場への参入と、それに伴う大規模な計算インフラ投資の具体的な動きが注目されます。

The Information: (翻訳) AIアジェンダ：XAI、企業および政府向けビジネス開始に近づく xAIはGrok AIを企業や政府機関に販売したいと考えている。そして、Anthropicは収益面で絶好調だ。@kevkubernetesと@steph_palazzoloによる詳細はこちら👇

Stephanie Palazzolo: (翻訳) Elon Musk氏のxAIがどのように収益を上げる計画なのかは、現在のAI分野における大きな疑問の一つです。@KevKubernetesと私は一つの可能性を考えています：このスタートアップは政府機関のデータを利用して、政府の顧客にモデルやアプリを販売することを望んでいるのではないかと。詳細はこちら：

Tech Dev Notes: (翻訳) David Faberとのイーロンの第2部彼は、メンフィス近郊に6～9ヶ月で100万GPUを収容するxAIの新しいデータセンターについて語っています！

コーディングAgent戦激化 Stability AI元CEO II-Agent公開続報

AIコーディングエージェント開発競争に関する続報です。
Stability AIの元CEO、Emad Mostaque氏がオープンソースの高性能コーディングエージェント「II-Agent」を公開し、大きな話題となっています。
「Chatbot戦争からCode Agent戦争へ」という言葉も聞かれるほど競争は激化しており、CursorやAiderなどの既存ツールに加え、II-Agentのような新たなOSSの登場が開発者の生産性向上への期待を一層高めています。
各ツールの実用性や使い分けに関する議論も引き続き活発です。

Nathan Lambert: (翻訳) チャットボット戦争からコードエージェント戦争へ。

Chubby♨️: (翻訳) やるぞおおお伝説の@EMostaqueが、おそらく世界最高のAIエージェントであるII-Agentを、無料でオープンソースとして、誰でも利用できるようにリリースしました！今日のインターネットが実際にはオープンソースの古参であるように、オープンソースが引き続き役割を果たすのを見ることができて感謝しています。

All Hands AI: (翻訳) 現在、https://t.co/y5emPmekEV への関心が急増しており（数日間でユーザー数が50%以上増加）、対応に追われています。多くの方々がコーディングエージェントを試すことに興奮しているのを見るのは素晴らしいことであり、すべてがスムーズに動作するように努力していますが、何か問題が発生した場合は申し訳ありません🙏

MS出資の英AI企業Faculty AI 経営破綻/資金難と報道

Microsoftが出資する英国のAIユニコーン企業Faculty AIが、経営破綻または資金難に直面していると複数の海外メディアが報じました。
同社はかつて10億ドル以上の評価額でしたが、今回の報道はAIスタートアップの厳しい競争環境や資金調達の難しさを示唆しています。
AI業界における淘汰の可能性も感じさせるニュースとして注目されます。

Financial Times: (翻訳) マイクロソフト支援の英国テックユニコーンFaculty AIが経営破綻

TechCrunch: (翻訳) かつて10億ドル以上の価値があったマイクロソフト支援のFaculty AIが資金難に | TechCrunch

Bloomberg: (翻訳) マイクロソフトが支援する人工知能スタートアップFaculty AIが破産手続きに入ります

Perplexity、AIエージェントブラウザ「Comet」早期提供開始

AI検索エンジンPerplexityが、AIエージェント機能を搭載した新しいウェブブラウザ「Comet」を早期テスター向けに提供開始しました。
このブラウザは、ユーザーの指示に基づいて自律的に情報収集やタスク実行を行うAIエージェントを活用し、ブラウジング体験を大きく変えることを目指しています。
Google ChromeへのGemini統合の動きなどもあり、ブラウザとAIの融合は業界全体で加速しています。

Chubby♨️: (翻訳) @testingcatalog は相変わらず最新情報に強いね：Perplexityがエージェント型ウェブブラウザを展開中！本当に楽しみだし、どんな性能か気になる。(引用: 速報🚨: Perplexityがエージェント型ウェブブラウザ「Comet」を初期テスター向けに展開開始。Vibeブラウジングはもうすぐそこ👀)

TestingCatalog News 🗞: (翻訳) I/Oもいいけど、新しいデフォルトがもうすぐそこまで来てるよ👀 (引用: 「Comet、Google I/Oの基調講演ライブストリームに連れてって」視聴中！🍿)

llama.cpp SWA対応 Gemma 3メモリ大幅削減【続報】

オープンソースのLLM推論ライブラリ「llama.cpp」のserverコマンドがSliding Window Attention (SWA) に対応したという続報です。
この対応により、Googleの軽量モデル「Gemma 3」実行時の必要メモリが大幅に削減されたと報告されています。
CPUメモリ14.9GBでの要約タスク実行や、プロンプト処理・トークン生成速度の向上も確認されており、より少ないリソースでのGemma 3活用が進むと期待されます。

webbigdata: llama.cppのserverコマンドがSliding Window Attention対応してGemma 3の必要メモリが激減前回超ギリギリだった要約タスクが少し余裕ある状態に CPUメモリ14.9GB プロンプト処理時間 110.71 tokens/秒トークン生成時間 3.08 tokens/秒速度も向上してます、凄い！なお、ディフォルトでONです https://t.co/...