2025年05月09日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Gemini・OpenAI・Waymoが進化を続ける最新動向
大手テック企業によるAI機能の拡充が続いています。Google AI StudioでGemini 2.5モデルのピッカー機能が提供開始され、年末までに大幅進化する可能性も示唆されました。
OpenAIはChatGPTのMemory機能を欧州地域に展開し、o4-miniへのRFT導入で複雑なドメインでの性能向上も報告。NVIDIAの3D再構築技術「3DGUT」やPFNの「Insight Scan」など新サービスも登場しています。
それでは各トピックの詳細についてご一緒に見ていきましょう。
目次
- Gemini API続報: 新モデルピッカーとキャッシュ機能の現状
- OpenAI Memory機能欧州展開、o4-miniにRFT導入(続報)
- Google AI Studio 年末に大幅進化を示唆【続報】
- 【続報】Waymoロボタクシー製造工場公開、競争激化
- NVIDIA、3D再構築技術3DGUTとAI基盤Dynamoを発表
- PFN 生成AIテキスト分析Insight Scan提供開始
- AIによるリアルタイムゲーム/アプリ生成技術が続々登場
Gemini API続報: 新モデルピッカーとキャッシュ機能の現状
- Gemini APIに関する続報です。
- Google AI Studioにて、Gemini 2.5 ProおよびFlashモデルを選択できるピッカーがPreview版として提供開始され、最新モデルへのアクセスが容易になりました。
- 既報の暗黙的キャッシュ機能(約75%のコスト削減効果)と合わせ、開発体験の向上が図られています。
- ただし、一部で旧バージョンを指定しても意図せず新バージョンが実行される問題が指摘されており、今後の改善が期待されます。
まつにぃ: Gemini2.5 Pro/Flashに自動的に適応されるコンテキストキャッシュ機能がロールアウトです。 冒頭部分の文字が同一ならflashは1k/Proは2kトークンを超えると自動でキャッシングし、入力トークンがなんと75%割引。 設定も不要で、従来の明示キャッシュとも併用可能です。 相当安くなりますね。
まつにぃ: Gemini 2.5Pro / Flashのモデルピッカー欄がPreviewになってますね! 0506対応したかな? https://t.co/idRPj9Ihso
erukiti: ついに!!!!!!望んでいたprompt cachingがきた!!!!!!!これだこれ!!!
OpenAI Memory機能欧州展開、o4-miniにRFT導入(続報)
- OpenAIはChatGPTのMemory機能を欧州経済領域(EEA)、英国、スイスなどで完全ロールアウトしました。過去の会話を参照し、よりパーソナライズされた応答が可能になります。これは、以前お伝えしたMemory機能に関する続報です。
- また、o4-miniモデルへの強化学習ファインチューニング(RFT)導入についても進展があり、思考の連鎖推論とタスク固有のグレーディングにより、特に複雑なドメインでの性能向上が報告されています。こちらも続報となります。
- 税務や会計領域で精度40%向上を達成した例もあり、より業務特化なカスタマイズが進むと期待されます。
OpenAI: (翻訳) 新しいメモリ改善機能は、EEA、英国、スイス、ノルウェー、アイスランド、リヒテンシュタインのPlusおよびProユーザーに完全に展開されました。
Greg Brockman: (翻訳) o4-miniで強化学習ファインチューニングが利用可能になりました:
まつにぃ: OpenAIはo4-mini向け強化学習型Finetuningを正式提供です。 税務や会計領域で精度40%向上達成。 さらにGPT-4.1 nanoも教師ありFinetuning対応で高速・低コスト特化モデルをカスタム可能です。 より業務特化なカスタマイズが加速しますね。
Google AI Studio 年末に大幅進化を示唆【続報】
- Google AI Studioに関する続報です。同ツールの責任者の一人Logan Kilpatrick氏が、年末までに大幅な進化を遂げることを示唆しました。
- Kilpatrick氏は、現在のAI Studioの機能について「まだ表面をなぞっているに過ぎない」と述べ、今後の大規模な機能拡充を示唆しています。
- GoogleによるAI関連の発表が続く中、AI Studioの今後の展開に注目が集まります。
Logan Kilpatrick: (翻訳) 今日のGoogle AI Studioは、年末までに実現されるもののほんの表面をなぞっているに過ぎません。エキサイティングな時代です!
Chubby♨️: (翻訳) 通常なら、これは無関係な誇大広告として無視するでしょう。しかし、Googleが最近リリースしたすべてのことを考えると、途方もない期待感を抱かずにはいられません。他に何が登場するのか本当に楽しみです。そして、ローガンが言うように、まだ始まったばかりだと信じています。
【続報】Waymoロボタクシー製造工場公開、競争激化
- Waymoのロボタクシー事業に関する続報です。
- The Informationは同分野で注目すべき9つのスタートアップおよび既存企業を挙げ、競争の激化を報じました。
- ForbesはWaymoのロボタクシー製造工場の内部を独占取材し、AI駆動フリートのカスタムコンピューティングシステムやセンサー群など、実用化に向けた詳細を伝えています。
The Information: (翻訳) Waymoの現実世界でのロボタクシー事業は、自動運転スタートアップと既存企業の間の競争に火をつけました。この進化する分野で注目すべき9社をご覧ください。
Forbes: (翻訳) ロボタクシーの未来を築くWaymo工場内部
Forbes: (翻訳) AI駆動フリートのカスタムコンピューティングシステム、カメラ、LIDAR、レーダーを備え、ジャガーEVをロボタクシーに変える施設内部を独占公開。間もなく、年間数万台のロボタクシーがラインオフする予定です。(写真: Waymo)
NVIDIA、3D再構築技術3DGUTとAI基盤Dynamoを発表
- NVIDIAがAI関連の新技術を発表し、開発基盤の強化を進めています。
- 3Dシーン再構築技術「3DGUT」を発表し、その利用促進のためのコンテストを開始しました。この技術は魚眼レンズやローリングシャッターなど複雑なカメラモデルもサポートします。
- また、AI推論のパフォーマンス向上とコスト削減を目指すAI基盤「Dynamo」および「Storage Next」も紹介されました。これらはKVキャッシュ処理の最適化やストレージとGPUの連携強化が特徴です。
NVIDIA AI Developer: (翻訳) #3Dシーン再構築の限界に挑戦する準備はできましたか?🏗️ 🎉 #NVIDIAResearch から3DGUT懸賞を開始します。📸 ✨ 魚眼やローリングシャッターなどの複雑なカメラモデル、さらにシーン後の照明やエフェクトをサポートするようになった3DGUTを使用してシーンを作成してください。その後、拡張してください。
NVIDIA AI Developer: (翻訳) 💡@thomascoughlin氏が、NVIDIA DynamoとStorage NextがAIのパフォーマンスを向上させ、AIコストを削減する方法を強調しています。KVキャッシュ処理を最適化し、ストレージをGPUに近づけることで、AI推論における次世代の効率を推進しています。@Forbesで続きを読む ➡️
PFN 生成AIテキスト分析Insight Scan提供開始
- 株式会社Preferred Networksが、生成AIを活用したテキストデータ分析サービス「PreferredAI™ Insight Scan」の提供を正式に開始しました。
- このサービスは、口コミ、アンケート、特許情報、パブリックコメントといった膨大なテキストデータを迅速に分析し、内容の分類ラベル提案や、対話形式でのインタラクティブな分析・可視化を支援します。
- 既に多くの問い合わせがあるとのことで、企業におけるテキストデータ活用の新たな手段として注目されます。
龍一郎 (f.k.a Asei Sugiyama): む、これLLMの有用な活用方法として推していたやつなんだけど、関連して特許とか取得されたんだろうか 生成AIの活用でテキストデータ分析を革新する PreferredAI Insight Scan を正式リリース - 株式会社Preferred Networks https://t.co/v1Od5qHT2J
Daisuke Okanohara / 岡野原 大輔: 昨日リリースしたInsight Scanは既に多くの問い合わせをいただいております。大量のテキスト(口コミ、アンケート、特許情報、パブコメなど)に対して、テキスト全体を分析し分類ラベルを提案、対話でインタラクティブに分析し可視化できます。興味がある方、ぜひお問い合わせください
AIによるリアルタイムゲーム/アプリ生成技術が続々登場
- AIを用いてリアルタイムでインタラクティブなコンテンツを生成する技術が注目を集めています。
- AIが生成するマルチプレイヤービデオゲーム「Multiverse」が発表され、プレイヤーが共有のAIシミュレート世界をリアルタイムで形成できるとされています。
- また、拡散モデルをベースとしたリアルタイムマルチプレイヤーレーシングゲームもHugging Face上で公開されるなど、生成AIの応用範囲がゲームやアプリ開発の分野で急速に広がっています。
Tanishq Mathew Abraham, Ph.D.: (翻訳) 非常に印象的です!マルチプレイヤーAIビデオゲームは、すべてのプレイヤーからのフレームとアクションを渡す点を除けば、シングルプレイヤーとまったく同じです。
Vaibhav (VB) Srivastav: (翻訳) 待って、これはリアルタイム拡散ベースのマルチプレイヤーレーシングゲームです - MITライセンス 🔥 Hugging Faceで公開中!
Aadit Sheth: (翻訳) この人は文字通り、簡単なプロンプトを使って17分未満でリアルタイムアプリを構築しています。