2025年09月09日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Geminiが音声ファイル対応、NotebookLMの大幅アップデート、AI業界の資金調達続く

今週のAI業界では、Googleの進化とAI企業への巨額投資が目立ちました。Geminiが音声ファイルを含む全形式のアップロードに対応し、NotebookLMはカスタムレポートやクイズ自動生成機能を追加。

一方で資金調達も活発で、Devin開発のCognitionが評価額102億ドル、Databricksは評価額1000億ドルという驚異的な数字を記録しています。

さらに、Google DeepMindの複数ロボット協調システム「RoboBallet」やxAIの「バックグラウンド思考」機能など、技術革新も続々と発表されています。それでは各トピックの詳細を見ていきましょう。

目次

  1. Gemini、音声ファイルを含む全形式のファイルアップロードに対応
  2. NotebookLM、カスタムレポートやクイズ自動生成機能を追加
  3. Devin開発のCognition、評価額102億ドルで資金調達【続報】
  4. Grok、思考を止めない「バックグラウンド思考」機能開発中
  5. Databricks、評価額1000億ドルで10億ドルを資金調達
  6. Google DeepMind、複数ロボットアームを協調させるRoboBallet発表
  7. Perplexity、政府向けプランとモバイル金融情報機能を提供開始
  8. AIの次のボトルネックは水消費量か、4年で11倍増の予測
  9. OpenAI、AI生成の長編アニメ映画「Critterz」を支援
  10. Alibaba、多言語対応の高性能音声認識モデルQwen3-ASRを発表

Gemini、音声ファイルを含む全形式のファイルアップロードに対応

  • GoogleのAIチャットサービスGeminiで、音声ファイルを含むあらゆる形式のファイルがアップロード可能になりました。
  • これまでGoogle AI Studioなど一部のサービスでしか利用できなかった音声ファイルの直接アップロードがWebアプリ版のGeminiでも対応したことで、利便性が大きく向上しています。
  • ユーザーからはファイルサイズの上限が見当たらないとの報告もあり、今後の活用に期待が寄せられています。
TestingCatalog News 🗞: (翻訳) Geminiで、音声を含むあらゆるファイル形式を会話にアップロードできるようになりました。制限なし👀 https://t.co/wgL3p8DsWP

Chubby♨️: (翻訳) Geminiにファイルアップロードが追加されました。アップロード上限は見つかりませんでした。

まつにぃ: お、今まではGoogle AI studioでしかできなかった(はずの)音声処理が通常のGeminiでもできるようになったんですね。 最近はあまり音声ファイル単体を扱うことは少なく、まあGemini CLIでいけるやろみたいな雑感なのですが、ウェブアプリ側も順当に進化してくれてると安心ですね。

NotebookLM、カスタムレポートやクイズ自動生成機能を追加

  • GoogleのAI搭載ノートアプリ「NotebookLM」に、レポート作成機能の強化や学習支援機能が追加される大幅なアップデートが行われました。
  • ユーザーが構造やスタイル、トーンなどを細かく指定して、ニーズに合わせたカスタムレポートを作成できるようになります。
  • さらに、アップロードした資料から自動でフラッシュカード(単語帳)やクイズを生成する機能も追加され、学習ツールとしての活用が期待されます。
NotebookLM: (翻訳) 本日よりレポート機能が大幅にアップデートされます(覚悟してください、これは大きなアップデートです🤯): 1) 構造、スタイル、トーンなどを指定することで、ニーズに完全に合った独自のレポートを作成できるようになりました。 2) レポートに言語ピッカーを追加しました。これにより、レポートを作成できるようになります。 https://t.co/qwDHKmlWGy

TestingCatalog News 🗞: (翻訳) Googleは、新しいトピックの学習を支援するために、NotebookLMでフラッシュカードとクイズの展開を開始します。 https://t.co/zDq3tfWbig

Devin開発のCognition、評価額102億ドルで資金調達【続報】

  • AIコーディングエージェント「Devin」を開発するCognitionの資金調達に関する続報です。
  • Peter Thiel氏率いるFounders Fundがリードし、評価額102億ドルで約4億ドルを調達したと報じられました。
  • AIエージェント開発競争が激化する中、同社の今後の動向が注目されます。
Bloomberg: (翻訳) 人工知能スタートアップのCognition AIは、約4億ドルの資金調達ラウンドで評価額102億ドルに達しました。この取引は、AIを活用したソフトウェア開発に対する投資家の熱狂が続いていることを浮き彫りにしています https://t.co/AmbtqPGzNr

TestingCatalog News 🗞: (翻訳) WindsurfとCognitionは、AIコーディングエージェントを進歩させるため、評価額102億ドルで4億ドルを調達しました。エージェントの年🤖 https://t.co/vWlKugr7Wl

TechCrunch: (翻訳) ピーター・ティールが支援するVCであるFounders Fundが、Cognitionの最新ラウンドを主導しました。既存投資家のLux Capital、Joe Lonsdaleの8VC、Elad Gil、Definition Capital、Swish Venturesも参加しています。https://t.co/QhOIfCno3C

Grok、思考を止めない「バックグラウンド思考」機能開発中

  • xAIのGrokに、チャットを続けながら裏で思考を続ける「バックグラウンド思考」機能が開発中であることが明らかになりました。
  • 時間のかかるタスクをGrokに任せている間も、ユーザーは他の対話や作業を並行して進められるようになり、待ち時間の大幅な短縮が期待されます。
  • あわせて、画像編集機能から動画生成(Imagine)へ直接移行できるオプションが追加されるなど、UIの改善も進められています。
Chubby♨️: (翻訳) 速報:GROKはバックグラウンド思考に取り組んでいます! https://t.co/irPwzozaVR

TestingCatalog News 🗞: (翻訳) xAIは、Grokが考えている間もチャットを続けられるように、ウェブ上に専用の「バックグラウンド思考」トグルを開発しています。 https://t.co/OgGXhsw4iW

Tech Dev Notes: (翻訳) Grok Webの画像編集機能に、Imagineにリダイレクトする動画作成オプションが表示されるようになりました https://t.co/D8D1JLamy6

Databricks、評価額1000億ドルで10億ドルを資金調達

  • データ・AI企業のDatabricksが、評価額1000億ドル以上で10億ドルの資金調達を完了したと発表しました。
  • AI分野の急速な成長を背景に、企業価値が大きく評価された形です。
  • 今回の調達により、同社の製品開発や市場拡大がさらに加速するものと見られます。
Bloomberg: (翻訳) 世界で最も価値のあるスタートアップの1つであるDatabricksは、10億ドルの資金調達ラウンドを完了し、ソフトウェアプロバイダーの評価額は1000億ドルを超えたと発表しました https://t.co/3l9DlkYJ0p

TechCrunch: (翻訳) 100億ドルという巨額の資金調達からわずか数カ月後、Databricksは評価額1000億ドルでさらに10億ドルの資金調達を確認しました。https://t.co/IzjEcCcotH

Google DeepMind、複数ロボットアームを協調させるRoboBallet発表

  • Google DeepMindが、複数のロボットアームを衝突させることなく精密に連携させるAIシステム「RoboBallet」を発表しました。
  • このシステムは、最大8台のロボットのタスクと動作計画を自動化でき、従来の手法より約25%優れた性能を発揮します。
  • 製造ラインの自動化など、複雑な協調作業が求められるロボット工学の分野での応用が期待されます。
Google DeepMind: (翻訳) 当社のAIシステムRoboBalletは、ロボットアームのチームを衝突なく連携させ、精密に振り付けすることができます。🤖 @IntrinsicAIおよび@UCLと共同で開発され、一度に最大8台のロボットのタスクと動作計画を自動化でき、従来の方法を約25%上回る性能を発揮します。https://t.co/I9DC0kCr29

Rohan Paul: (翻訳) 🦾 ロボット工学に関する主要な新しい研究、AI「ロボットバレエ」は、@GoogleDeepMind、@IntrinsicAI、@UCLによって開発された生産ラインを振り付けます。🎯 RoboBalletは、8台のロボットアームが40のタスクを数秒で処理し、数百時間を節約するAIプランナーです。一般的なチームワークを学習します https://t.co/Ru4dKNOxvB

Perplexity、政府向けプランとモバイル金融情報機能を提供開始

  • AI検索エンジンのPerplexityが、米国政府機関向けの「Perplexity for Government」と、モバイルアプリ向けの金融情報機能「Perplexity Finance」を相次いで発表しました。
  • 政府向けプランでは、トレーニングにデータを利用しないなどセキュリティを強化し、政府機関が安全に最新のAIモデルを利用できる環境を提供します。
  • また、モバイルアプリでは株価検索や金融情報に特化した機能が追加され、より専門的な情報収集ツールとしての進化を見せています。
TestingCatalog News 🗞: (翻訳) Perplexityが政府向けPerplexityを発表。最新のAIモデルとトレーニング用のデータ使用量ゼロ。素晴らしい計画👀 https://t.co/ZnMP8TlNwt

TestingCatalog News 🗞: (翻訳) 速報🚨:Perplexityモバイルアプリで、全機能搭載のPerplexity Financeが利用可能になりました!新しいターミナル👀 https://t.co/DHZSeGApGh

AIの次のボトルネックは水消費量か、4年で11倍増の予測

  • AI開発の急拡大に伴い、電力に次ぐ新たなボトルネックとして「水」の消費量が問題になる可能性が指摘されています。
  • Morgan Stanleyの予測によると、2028年までにAIの年間水消費量は2024年比で11倍に達するとのことです。
  • データセンターの冷却には大量の水が必要であり、特に水資源が乏しい地域でのAIインフラ増強には、持続可能性の観点から新たな課題が生まれています。
Jukan: (翻訳) 「電力の次にAIのボトルネックとなるのは水だ。」 これは魅力的なトピックではないでしょうか? モルガン・スタンレーは、2028年までにAIの水消費量が年間約1,068億リットルに達し、2024年比で11倍に増加すると予測しています。 もちろん、絶対的な規模はまだ小さいです https://t.co/UF9gyMSQo6

Rohan Paul: (翻訳) AIの次のボトルネックは電力の次は水になるでしょう。モルガン・スタンレーの基本シナリオでは、2028年に必要な水の量は1兆680億リットルで、2024年の需要の11倍です。そして、大規模ハブの50%以上はすでに中程度以上の水ストレス地域にあります。データセンターは2か所で水を使用します。https://t.co/lkJQASnysu

OpenAI、AI生成の長編アニメ映画「Critterz」を支援

  • OpenAIが、生成AIを用いて制作される長編アニメーション映画「Critterz」を支援していることが明らかになりました。
  • このプロジェクトは、従来のハリウッド映画よりも大幅に速く、低コストで映画を制作できることを示すのが狙いです。
  • 2026年5月のカンヌ国際映画祭での公開を目標としており、AIによる映画制作が本格化する試金石として注目されています。
Rohan Paul: (翻訳) 🎨 OpenAIは、生成AIがハリウッドよりも大幅に速く、低コストで映画を制作できることを示したいと考えています。同社は、主にAIで制作された長編アニメーション映画「Critterz」を支援しており、2026年5月のカンヌ国際映画祭と来年の世界的な劇場公開を目指しています。売りは、縮小することです https://t.co/qwKHFgo9qd

Haider.: (翻訳) AI映画製作は2026年に始まる OpenAIは、来年公開予定のAI生成アニメーション映画を支援しており、9か月で3000万ドル未満の予算で完成させる 目標は前例を作ることだ:たとえ最初の映画が素晴らしくなくても、より速く、より安価なAI製作方法を証明できれば https://t.co/iBD6bVlqYD

Alibaba、多言語対応の高性能音声認識モデルQwen3-ASRを発表

  • Alibabaが、多言語対応のオールインワン音声認識モデル「Qwen3-ASR」を発表しました。
  • このモデルは、英語・中国語に加えて日本語、韓国語など9言語に対応し、言語の自動検出も可能です。
  • 歌やラップ、BGM付きの音声など、困難な条件下でも高い認識精度を誇り、ノイズの多い環境や遠距離からの音声にも強いとされています。
Qwen: (翻訳) 🎙️ オールインワン音声認識モデル、Qwen3-ASRをご紹介します!✅ 高精度の英語/中国語+9言語以上:ar、de、en、es、fr、it、ja、ko、pt、ru、zh ✅ 自動言語検出 ✅ 歌?ラップ?BGM付きの音声?問題ありません。WER 8%未満 ✅ ノイズ、低品質、遠距離でも動作 ✅ カスタム https://t.co/eE1ucgYpVX

Junyang Lin: (翻訳) これが全くあなたの期待通りではないと確信しています!

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください