2025年05月21日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Googleが新技術続々発表、AIの限界を超える動き

今週のAI業界では、Googleからの重要発表が相次いでいます。音声付きデモが公開された「Veo 3」のGeminiアプリでの提供開始、GPT-3.5を凌駕すると報告される「Gemini 2.5 Flash」の全ユーザー展開、毎秒1500トークンという驚異的な生成速度を実現した「Gemini Diffusion」技術の発表などが注目を集めています。

一方で、xAIの100万GPU規模スパコン計画や、NVIDIAのCEOによる対中輸出規制への批判など、AIインフラと国際政治の話題も重要です。また、AI利用料の高騰は「AI税」とも表現され、今後の普及に影響を与える可能性があります。

それでは各トピックの詳細を見ていきましょう。

目次

  1. Veo 3続報: 音声付きデモ動画公開、Geminiアプリで提供開始
  2. Gemini 2.5 Flash最新版、全ユーザー展開。o3凌駕の報告も
  3. Google新技術Gemini Diffusion発表 毎秒1500トークン実現
  4. xAI、100万GPUスパコンにNVIDIA Blackwell導入報道【続報】
  5. Gemma 3n正式発表、2GB RAMで音声理解対応【続報】
  6. NotebookLM、音声概要の長さ調整機能追加【続報】
  7. NVIDIA CEO 対中輸出規制を「失敗」と批判
  8. Google、Warby Parker AIメガネへ最大$150M投資 続報
  9. AI利用料高騰、「AI税」も登場 個人・企業の負担増が課題

Veo 3続報: 音声付きデモ動画公開、Geminiアプリで提供開始

  • Googleの動画生成AI「Veo 3」に関する続報です。
  • キャラクター同士が会話するマフィン動画や、スタンドアップコメディアンのジョーク動画など、音声付きの具体的なデモが公開され、その表現力に注目が集まっています。
  • Veo 3はGoogle AI Ultraプラン加入者向けに、Geminiアプリ内で提供が開始されました。
  • OpenAIのSoraとの比較も引き続き活発で、今後の映像制作への影響が期待されます。
Soumith Chintala: (翻訳) うわー、これはすごい。 (引用ツイート: 動画生成のサイレント時代にさよなら:ネイティブ音声生成機能を備えたVeo 3が登場。🗣️ Veo 2から品質が向上し、キャラクター間のセリフ、効果音、背景ノイズを追加できるようになりました。Veo 3はGoogle AI Ultra向けGeminiアプリで現在利用可能です https://t.co/7rcXeBslyU)

Chubby♨️: (翻訳) これはヤバい。OpenAIはSoraを至急アップデートすべきだ。 (引用ツイート: 私の最初のVeo 3生成 > オーブンで焼かれている2つのマフィンの会話動画。最初のマフィン「このVeo 3ってやつが会話できるようになったなんて信じられない!」、2番目のマフィン「うわー、しゃべるマフィンだ!」 https://t.co/VA2VUZF8sS)

Google Gemini App: (翻訳) 召し上がれ 🍝 https://t.co/X51LGk1Kjm (引用ツイート: ウィル・スミスがスパゲッティを食べてからまだ2年も経っていないなんて…)

Gemini 2.5 Flash最新版、全ユーザー展開。o3凌駕の報告も

  • Googleの軽量AIモデル「Gemini 2.5 Flash」の最新プレビュー版(05-20)が公開され、Web上の全Geminiユーザーへの展開が開始されました。これは以前報じられたプレビュー版に関する続報です。
  • 本モデルは高性能と低コストを両立しており、一部ベンチマークではOpenAIのGPT-3.5 (o3)を凌駕する結果が報告され、特にコード関連タスクでの強さが評価されています。
  • レスポンス速度も特徴で、これまでコストや速度の制約で高性能モデルの導入が難しかったユースケースでの活用が期待されます。
TestingCatalog News 🗞: (翻訳) アップグレードされたGemini 2.5 Flashが、Web上のすべてのGeminiユーザーに展開されています https://t.co/mquwQHQrcS (引用ツイート: @testingcatalog flash 2.5が公開されたよ、やったー、すごい @btibor91 https://t.co/RLesePQbXN)

シェイン・グウ: Gemini-2.5-Flash-Preview-05-20が公開されました。なんとFlashがo3の性能を凌駕する結果を達成した。さらに今回のリリースにおいては、ある課題に対する解決策を本モデルに実装できたことも大きな成果で嬉しい。事前学習、事後学習、サービングに触れる良い機会でした。 https://t.co/RjQEtGZE7N

Kai INUI: 新しいGemini-2.5-Flash-Preview-05-20本当に素晴らしい レスポンス早いし、コード関連タスクも激強 Flashはミニ版の意識が強かったけど、賢いモデルかつレスポンス早くほしいユースケースでかなり積極的に使えるようになった。

Google新技術Gemini Diffusion発表 毎秒1500トークン実現

  • Googleは、LLMの生成に拡散モデルを採用した「Gemini Diffusion」を発表しました。
  • これにより、従来の自己回帰型モデルと比較して約5倍となる毎秒1500トークンという驚異的な生成速度を実現したと報告されています。
  • 特に、コードの途中補完や修正が多いコーディングタスクでの有効性が期待されていますが、他のタスクにおいても性能向上が見込まれます。
  • この技術は、LLMの応答速度に関する課題を大きく改善する可能性を秘めており、多くの開発者がその高速性と実用化の速さに注目しています。
Daisuke Okanohara / 岡野原 大輔: Gemini DiffusionはLLMの生成で拡散モデルを採用し従来の5倍近い生成速度(1500トークン/秒)を実現 拡散モデルを採用したLLMは商用モデル(Mercury)や研究(LLaDa等)が登場している。特に途中を修正することが多いコーディングに向いているが、他タスクでも追いつくだろう https://t.co/ICgZKffapr

まつにぃ: ここにGemini2.5 Pro以上の頭脳が付いたら、もう人間には処理できない次元ですね〜。 これが並列で動く未来.. (引用ツイート: Google Gemini Diffusion試した。 すげええええええええええ。 はやwwwwwww ゲームチェンジャーでゲームオーバー! (早送りとかしてないです。ただのMacの画面動画キャプチャ) https://t.co/U6u28OyFng)

べいえりあ: 本日のGoogle I/Oで個人的に一番ビックリしたのはGemini Diffusionでした☺️(Diffusionモデルが精度面でautoregressiveモデルの背中が見えるところまで来たのかというのと、推論がハチャメチャに速いという意味で) https://t.co/9sXJAMmHgr

xAI、100万GPUスパコンにNVIDIA Blackwell導入報道【続報】

  • Elon Musk氏率いるxAIが、メンフィス近郊に建設予定の100万GPU規模スーパーコンピュータに、NVIDIAの次世代AIチップ「Blackwell」を導入する計画であると報じられました。これは以前報じられた大規模スパコン計画の続報です。
  • 導入されるGPUはHGX B200またはB300システムと見られており、実現すればAIモデルの学習と推論能力が大幅に向上すると期待されます。
  • Musk氏自身もこの計画に言及しており、AI開発における計算能力競争でxAIが大きな存在感を示すことになりそうです。
Tech Dev Notes: (翻訳) デビッド・フェイバーとのイーロンの第2部。彼はメンフィス近郊に6~9ヶ月で100万GPUを収容するxAIの新しいデータセンターについて語っています! https://t.co/63OLJY4Mqf

パウロ: イーロン・マスクによるBlackwell爆買いきたーーー $TSLA Teslaは100万基のBlackwellを新しいxAIの設備に展開する予定 100万基はBlackwellの年間生産の1/5~1/6となります とんでもねぇ (引用ツイート: Elon Musk just said Tesla $TSLA will deploy 1 MILLION Nvidia $NVDA Blackwe...

パウロ: ただ、xAIはGB200/300 NVL72じゃなくて、HGX B200/B300なんよね 当初の予定通りGBシリーズを主力にするのは難しそうね

Gemma 3n正式発表、2GB RAMで音声理解対応【続報】

  • 先日プレビュー版が発表されたGoogleのオンデバイスAIモデル「Gemma 3n」が正式発表されました。わずか2GBのRAMでも動作可能で、Gemini Nanoと同じアーキテクチャを共有しています。新たに音声理解機能が追加され、マルチモーダル対応となりました。クラウド接続なしで動作するため、モバイルデバイスでのAI活用が一層進むと期待されます。一部のベンチマークではClaude 3.7 Sonnetに匹敵する性能も報告されており、軽量ながら高い能力を持つモデルとして注目されています。
Google AI: (翻訳) わずか2GBのRAMで動作するモデル、Gemma 3nをご紹介します🤯 Gemini Nanoと同じアーキテクチャを共有し、信じられないほどのパフォーマンスを実現するように設計されています。音声理解機能を追加したことで、マルチモーダルで高速かつ軽量になり、オンデバイスで動作します(クラウド接続は不要です!) https://t.co/2FyzJHVGZa

Philipp Schmid: (翻訳) Gemma 3nはこんな感じ。 https://t.co/KvD4ZmIFjM

まつにぃ: Gemma 3nの左隣にClaude 3.7 Sonnetがいて、このレベルと肉薄するnanoモデル相当優秀さんでは無いですか?? ちなみにこれはチェスの対局ベンチで、この子に勝てる気がしません。 https://t.co/oYos9FDuvK

NotebookLM、音声概要の長さ調整機能追加【続報】

  • GoogleのAIノートアプリ「NotebookLM」の音声概要機能が強化され、長さを短め(約5分)、標準(約10分)、長め(約20分)から選択できるようになりました。
  • また、Google I/Oの発表内容をまとめたNotebookLMのノートブックが公式に公開され、このノートから音声概要の聴取、サマリー作成、マインドマップ表示などが可能です。
  • 既報のVideo Overviews機能とあわせて、NotebookLMは情報収集・整理ツールとしての機能を着実に強化しています。
NotebookLM: (翻訳) 皆さん、これだけではありません...手短に言うと、オーディオ概要の長さをコントロールできるようになりました(現在は英語のみですが、まもなく他の言語も対応予定です!)。短め(約5分以上)、長め(約20分以上)、デフォルト(約10分以上)の設定で、AIホストがあなたのソースについて議論する深さと長さを完全にカスタマイズしてみてください! https://t.co/q7tPG1l0j0

Google AI: (翻訳) 今日はたくさんのことをカバーしました。幸いなことに、@NotebookLMの友人たちが今日のニュースと基調講演をすべてノートブックにまとめてくれました。これにより、音声概要を聞いたり、要約を作成したり、#GoogleIO 2025のすべてに関するマインドマップを表示したりすることができます。 https://t.co/8xhSv89uMI https://t.co/5LcUYfURls

TestingCatalog News 🗞: (翻訳) Google I/Oの今日の発表の概要を含む、ビデオ概要のもう一つの素晴らしい例です。引用スレッドには、I/Oコンテンツとチャットできる公開ノートブックもあります。ビデオ概要もまもなく展開開始予定です! https://t.co/gGEr7JwlAc (引用ツイート: そして、#GoogleIO の開発者向け発表をまとめたものがこちらです:(約束します、ビデオ概要はもうすぐです!) h...

NVIDIA CEO 対中輸出規制を「失敗」と批判

  • NVIDIAのJensen Huang CEOが、米国による対中国へのAIチップ輸出規制について「失敗だった」との見解を示し、業界に波紋を広げています。
  • 同氏は、規制によってNVIDIAの中国市場におけるシェアが過去4年で95%から50%に低下したと指摘。
  • Huaweiのような中国企業が独自のAI製品を開発するきっかけになったと批判しています。
  • AI技術の輸出規制緩和を求める声であり、今後の米中間の技術覇権争いやNVIDIAの戦略に影響を与える可能性があります。
Financial Times: (翻訳) Nvidiaの黄CEO、米国の対中チップ規制は「失敗」と発言 https://t.co/VfeYFTfM41

Financial Times: (翻訳) 「4年前、Nvidiaは中国で95%の市場シェアを持っていた。今日ではわずか50%だ」とCEOは述べ、ファーウェイなどの競合他社が独自のAI製品を開発するきっかけとなった規制を批判した。 https://t.co/xEzWshSz3I https://t.co/Qct9P5Pzgm

Bloomberg: (翻訳) Nvidiaのジェンスン・フアンCEOは、米国に対し、中国へのAI技術の輸出規制を緩和するよう呼びかけた。さもなければ、ファーウェイなどの新興ライバル企業に数十億ドルの収益を奪われるリスクがあると述べた。 https://t.co/lCQ25cO2RN

Google、Warby Parker AIメガネへ最大$150M投資 続報

  • GoogleとメガネブランドWarby ParkerのAIメガネ開発に関する続報です。
  • Googleは本プロジェクトに最大1億5000万ドルを投資すると報じられています。
  • 初期投資として7500万ドルがコミット済みで、マイルストーン達成に応じて追加で7500万ドルが投資されるほか、Warby Parkerの株式取得も計画されています。
TechCrunch: (翻訳) Google、Warby ParkerとのAIメガネ開発に1億5000万ドルをコミット | TechCrunch https://t.co/FjH6e7nhwy

Tetsuro Miyatake: GoogleのプロトタイプのAIスマートメガネ。 https://t.co/DbDwulBgvz https://t.co/Do6ol6KFpP

Tetsuro Miyatake: Warby ParkerがGoogleとAIスマートメガネの共同開発を行い、Googleは最大$150Mほどプロジェクトに投資することを発表した。 Googleは既に$75Mほどコミットしていて、マイルストーンを達成した場合追加で$75M投資してWarby Parkerの株も取得するとのこと。 https://t.co/PbPYel04es

AI利用料高騰、「AI税」も登場 個人・企業の負担増が課題

  • 高性能なAIモデルやツールの利用料金が高額化しており、個人開発者や小規模チーム、さらには企業にとっても負担が増しているとの懸念が広がっています。
  • 主要なAIサービスを複数契約すると月額数万円に達するケースもあり、この状況を指して「AI税」と表現する声も出始めています。
  • AI技術の恩恵を広く行き渡らせるためには、コストパフォーマンスの高い選択肢や、個人でも利用しやすいプランの充実が求められています。
石川陽太 Yota Ishikawa: AIガチ勢のAI税がどんどん上がっていく😭 主要3社だけで、月額合計79355円に ・Google AI Ultraプラン → 36070円 ・ChatGPT Proプラン → 28855円 ・Claude Maxプラン → 14430円 (※他多数)

mizchi: そろそろAI利用料金個人で払うのしんどくなりそう

ぬこぬこ: 毎月 20 万、学習用にさくらの高火力 PHY 使いたいので追加で毎月 305 万でも良いですか... (引用ツイート: 弊社のブーストパックなら毎月 1 人 5 万円まで AI ツールが使えまして ...(宣伝) ただ Google AI Ultra とか ChatGPT Pro とか契約しだすと足りなくなる可能性のほうが高いので、利用レベルに応じて増額しないといけないなぁと思ってます)

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください