2025年07月18日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
OpenAIの自律AI新展開とUberのロボタクシー参入
OpenAIが自律型AI「ChatGPT Agent」を発表し、仮想環境での自律的なタスク実行と専門的ベンチマークでの高いスコア達成が注目されています。
GoogleのVeo 3がGemini API経由で開発者向けに提供開始され、Uberが電気自動車メーカーLucidと自動運転技術のNuroと提携してロボタクシー事業に参入する計画を発表しました。
AIコードアシスタント「Lovable」は創業わずか8ヶ月でユニコーン企業となり、xAIの巨大スパコン「Colossus」は持続可能な冷却システムの構築を進めています。
それでは各トピックの詳細を見ていきましょう。
目次
- OpenAI、新自律AI「ChatGPT Agent」発表【続報】
- Google動画AI Veo 3、Gemini API経由で提供開始【続報】
- Uber、Lucid・Nuroと提携しロボタクシー事業へ
- AIコードアシスタント「Lovable」続報、創業8ヶ月でユニコーンに
- MacアプリConductor登場 複数Claude Codeを並列実行
- Slack、AIによる検索強化やハドル要約機能を発表
- xAIスパコン計画続報、冷却用に世界最大級の水処理施設を建設
- Kaggleでテーブルデータ用NNモデル「TabM」が注目
- Hume AI、声と話し方を模倣する新音声AI「EVI 3」公開
OpenAI、新自律AI「ChatGPT Agent」発表【続報】
- 以前お伝えした「Operator」と「Deep Research」を統合・強化した、新たな自律型AI「ChatGPT Agent」をOpenAIが発表しました。これは続報です。
- 仮想コンピュータ環境内でブラウジングやコーディングなどを自律的に実行し、投資銀行業務などの専門的なベンチマーク「HLE」で41.6%の高いスコアを達成しています。
- タスクの自動化やスケジュール実行も可能で、AIエージェント時代の本格的な到来を告げるものとして注目されています。
Greg Brockman: (翻訳) OpenAIを設立したとき(10年前!)、私たちの目標の1つは、キーボード、マウス、画面ピクセルを使って、人間と同じようにコンピューターを使えるエージェントを作ることでした。ChatGPT Agentはそのビジョンに向けた大きな一歩であり、その恩恵を思慮深く世界にもたらすものです。
Chubby♨️: (翻訳) OpenAIエージェントモード:HLE約42% すごい!FrontierMathではほぼ倍になりました!今のところ、感心しています。
TechCrunch: (翻訳) OpenAIがChatGPTに汎用エージェントを搭載 | TechCrunch
Google動画AI Veo 3、Gemini API経由で提供開始【続報】
- Googleの動画生成AI「Veo 3」の続報です。
- 新たにGemini APIとAI Studioを通じて、有料プレビューとして開発者向けに公開されました。
- これにより、既に提供されているVertex AIに加え、開発者は自身のアプリケーションやワークフローにVeo 3をより柔軟に組み込めるようになります。
Google DeepMind: (翻訳) Veo 3で構築を始めましょう:当社の最先端の動画生成モデルが、Gemini APIと@Google AI Studioを介して有料のパブリックプレビューで利用可能になりました。🎨 試してみる方法はこちら→ https://t.co/3P2F0awQUz https://t.co/KLDfZ3okk4
Google AI: (翻訳) 本日、動画ワークフローの効率化を支援するため、Gemini APIとVertex AIを介して開発者向けにVeo 3を有料プレビューでリリースします。✨ Veoの素晴らしい視覚的出力と音声を組み合わせる簡単な方法が欲しいというフィードバックをいただきました。Veo 3のネイティブオーディオ機能により、それが可能になります。
Patrick Loeber: (翻訳) ついに!Veo 3でのビルド、楽しんでください :)
Uber、Lucid・Nuroと提携しロボタクシー事業へ
- ライドシェア大手のUberが、電気自動車メーカーLucidおよび自動運転技術のNuroと提携し、ロボタクシー事業に参入します。
- UberはLucidに3億ドルを投資し、2026年のサービス開始を目指すとしています。
- この提携により、自動運転技術を活用したプレミアムな配車サービスが現実のものとなろうとしています。
Financial Times: (翻訳) Uber、Lucidと数十億ドル規模の電気ロボタクシー車両契約に合意
Bloomberg: (翻訳) Uberは電気自動車メーカーのLucidと自動運転技術のスタートアップNuroと提携し、ロボタクシーのフリートを立ち上げます。
TechCrunch: (翻訳) UberがNuroと提携、Lucidに3億ドルを投資して高級ロボタクシーサービスを開始 | TechCrunch
AIコードアシスタント「Lovable」続報、創業8ヶ月でユニコーンに
- 先日、ARR6000万ドル達成のニュースをお伝えしたAIコードアシスタント「Lovable」が、ユニコーン企業となりました。
- Accelが主導するラウンドで2億ドルを調達し、評価額は18億ドルに達しています。
- 創業からわずか8ヶ月でのユニコーン達成は、AI開発ツール市場への高い期待を象徴しています。
TechCrunch: (翻訳) Lovable、創業わずか8ヶ月で2億ドルのシリーズAを調達しユニコーンに | TechCrunch
Bloomberg: (翻訳) ソフトウェア開発を効率化するスウェーデンの人工知能スタートアップLovableは、資金調達ラウンドで2億ドルを調達し、ヨーロッパで最新のユニコーン企業となった。
Forbes: (翻訳) AI「Vibe Coder」のLovableがスウェーデン最新のユニコーンに
MacアプリConductor登場 複数Claude Codeを並列実行
- 複数のClaude Codeエージェントを並列で実行できるMac用アプリ「Conductor」がリリースされ、開発者の間で話題になっています。このツールは、複数のタスクを同時にエージェントに処理させたい場合に有用で、gitのワークツリー管理などを自動で行ってくれます。AIエージェントを活用した開発の効率化がさらに進みそうです。
Ian Nuttall: (翻訳) 複数のClaude Codeエージェントを同時に実行したいなら、Conductorを使ってください🔥 美しいUIで、gitのワークツリー関連の作業をすべて代行してくれます!チャーリーは本当に才能があり、すでに複数のモデルと同時にチャットできるChorusを構築しています。
久保田 雅也@Coalis: Cursolの引き抜かれた開発者が2週間経ってAnthropicに出戻りとか。人材争奪戦が理解不能なレベルに https://t.co/8kNFHBp5w7
erukiti: Claude Code SDK 使えてないんだよなー #claudecode_findy
Slack、AIによる検索強化やハドル要約機能を発表
- SlackがAIを活用した新機能を発表しました。
- これにより、プラットフォーム内の検索機能が強化されるほか、音声チャット機能「ハドル」の文字起こしや要約が自動で生成されるようになります。
- ビジネスコミュニケーションツールへのAI統合がさらに進み、業務効率の向上が期待されます。
TechCrunch: (翻訳) Slack、AIで検索を強化、ハドルに文字起こしと要約を追加 | TechCrunch
xAIスパコン計画続報、冷却用に世界最大級の水処理施設を建設
- メンフィスで建設中のxAIの巨大スーパーコンピューター「Colossus」に関する続報です。
- 同社はスパコンの冷却用に、世界最大級の水処理・リサイクル施設を建設していることを明らかにしました。
- この施設ではセラミック膜バイオリアクター(MBR)技術を用い、1日あたり1300万ガロンの廃水を再利用する計画です。
- 地域の水資源に負荷をかけずに大規模計算基盤を維持する、持続可能性への取り組みが注目されます。
Tech Dev Notes: (翻訳) xAIはメンフィスに世界最大のセラミックMBRを建設中です!これにより、コロッサススーパーコンピューターおよび近隣の工場の冷却用に、1日あたり1300万ガロンの廃水がリサイクルされます。地域の飲料水への影響はゼロです。
Kaggleでテーブルデータ用NNモデル「TabM」が注目
- テーブルデータ(表形式データ)向けのニューラルネットワークモデル「TabM」がKaggleコミュニティで注目を集めています。
- Yandexが開発したこのモデルは、Kaggleコンペティションのトップソリューションで採用されるなど、その性能が評価されています。
- これまで決定的な手法がなかったテーブルデータ分析において、新たなアプローチとして期待されています。
Maxwell! 🌃 🌻 🐇 ☃: 昨年登場以降,Kaggle で top solution に採用されたり,その頭角を現してきている TabM も挙げられていた テーブル用 NN ってコレってのがないので,単純な MLP を解説して終わりにしてるんだけど,Yandex 製とはいえ TabM は講義にとり入れても良いかもなぁと思っている → https://t.co/ieeD3l7Kut
Hume AI、声と話し方を模倣する新音声AI「EVI 3」公開
- Hume AIが、新しい音声言語モデル「EVI 3 (Empathic Voice Interface)」を公開しました。
- このモデルは、単に声をクローンするだけでなく、話し方や言語スタイル、さらには個性までを模倣することができます。
- より人間らしく自然な対話が可能なAIの実現に向けた一歩として、今後の応用が期待されます。
Rohan Paul: (翻訳) これは超リアルな音声AIです。📢 Hume AIのEVI 3は、彼らの共感的音声インターフェース(EVI)であり、最もリアルで指示可能な音声から音声への基盤モデルとして設計された音声言語モデルです。あなたの声だけでなく、話し方やスタイルも模倣できます。