2025年04月24日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

ChatGPT制限緩和とGPT-4o画像生成API公開:AI活用の幅広がる

AIの利用範囲が大きく拡大しています。ChatGPTの有料プランではo3/o4-miniモデルの利用制限が倍増し、OpenAIはGPT-4o画像生成APIの提供を開始しました。

一方、PerplexityはiOSデバイス操作機能を追加し、韓国発のOSS音声合成モデル「Dia」は感情表現に優れた性能を示しています。Google GeminiのMAUは3.5億人に達し、OpenAIは2029年に1250億ドルの収益予測も報じられました。

それでは各トピックの詳細を見ていきましょう。

目次

  1. 【続報】ChatGPT有料プラン、o3/o4-mini利用制限を倍増
  2. (続報) OpenAI、GPT-4o画像生成APIを提供開始
  3. Perplexity Assistant、iOSデバイス操作機能を追加
  4. OSS音声合成モデル「Dia」続報:感情表現やリアルタイム処理に強み
  5. Gemini月間ユーザー3.5億人と報道【学生無料提供続報】
  6. OpenAI、2029年収益1250億ドル超予測、新オープンモデル初夏リリースか
  7. Windsurf、価格引き下げで競争激化に対応
  8. Hugging Face、Code Agents構築の新コース公開
  9. NVIDIA、AIエージェント強化用NeMoマイクロサービス提供開始
  10. AI Agent開発: 実用化の課題と自律化への道筋

【続報】ChatGPT有料プラン、o3/o4-mini利用制限を倍増

  • ChatGPTの有料プラン(Plus, Team, Enterprise)ユーザー向けに、o3およびo4-mini-highモデルの利用回数制限が2倍に引き上げられたことが発表されました。これは以前報告されたレート制限(o3: 週50、o4-mini-high: 日50)からの緩和となります。
  • 今回の変更により、o3は週100メッセージ、o4-mini-highは1日100メッセージまで利用可能になります(o4-miniは1日300メッセージ)。
  • これにより、有料ユーザーはこれらのモデルをより多く活用できるようになります。
Chubby♨️: (翻訳) chatgpt plus加入者向けにo3とo4-mini-highのレート制限を2倍にしました。お楽しみください!

Tibor Blaho: (翻訳) 更新:OpenAIはChatGPT Plus、Team、Enterpriseユーザー向けにo3とo4-miniのレート制限を2倍にしました。週100メッセージ(o3)、1日300メッセージ(o4-mini)、1日100メッセージ(o4-mini-high) https://t.co/3qDHhLDGuh

ぬこぬこ: ChatGPT Plus で o3 / o4-mini-high のレートリミットが二倍に!!!うれしすぎる!

(続報) OpenAI、GPT-4o画像生成APIを提供開始

  • 以前お伝えしたGPT-4oの画像生成API提供について続報です。OpenAIは、GPT-4oの画像生成機能をAPI経由で利用可能にしたと正式に発表しました。
  • このAPIは、より高忠実度で多様なスタイルの画像生成、テキストの正確なレンダリング、精密な画像編集機能を提供します。
  • 開発者はPlaygroundおよびAPIを通じて利用可能で、生成時の「effort (労力)」を低・中・高から選択できるパラメータも用意されています。
OpenAI Developers: (翻訳) 画像生成がAPIで利用可能になりました! 本日より、ChatGPTの強力な画像生成機能を世界中の開発者が利用できるgpt-image-1をリリースします。 ✅ より正確で高忠実度な画像 🎨 多様な視覚スタイル ✏️ 精密な画像編集 🌎 豊かな世界 https://t.co/ndC3hIpSlX

TestingCatalog News 🗞: (翻訳) 速報🚨: OpenAIはgpt-image-1を発表しました。これはPlaygroundおよびAPI経由で利用可能な新しい画像生成モデルです。ユーザーはこのモデルの「effort」を低、中、高の間で調整することもできます。 https://t.co/fAW63GoxlS

ML_Bear: 待望のGPT Image APIが登場したとのこと。ジブリ風の画像とか描いてくれて話題になったやつのAPI版かと思われます。 テキストを画像上に合成したり、きめ細かな画像編集したり、ジブリ風にしたりと様々な例が載ってました。このAPIも流行るんだろうなぁ😇 https://t.co/1bm9BsJrlW https://t.co/0FPwHWGSF0

Perplexity Assistant、iOSデバイス操作機能を追加

  • AI検索エンジンのPerplexityが、iOSアプリ版にデバイス操作機能「Perplexity Assistant」を追加しました。
  • 音声アシスタントを通じて、メディア再生、メール作成、会議移動、配車予約、レストラン予約、リマインダー設定などが可能になります。
  • AIが情報検索だけでなく、ユーザーの代わりに具体的なアクションを実行するエージェントとしての進化を示しています。
TestingCatalog News 🗞: (翻訳) 速報🚨: Perplexity Voice AssistantがiOSデバイスを制御できるようになりました。 - メディア再生 - メール作成 - 会議移動 - 配車予約 - レストラン予約 - リマインダー設定 など 👀 https://t.co/DFBrAODncv

Chubby♨️: (翻訳) 私だけかもしれませんが、また別のショッピング/レストラン/予約/旅行AIエージェントにはうんざりしています。本当にどうでもいいです。AIには重要なこと、研究、科学、個別指導、精神的・身体的健康などをやってほしいのです。でも、間違いなく、また退屈なショッピングエージェントは要りません。

Alvaro Cintas: (翻訳) Gensparkは私が試した中で最高のAIエージェントかもしれません。エージェント的に調査を行い、ウェブページを作成し、ビデオを生成し、AIに電話をかけて予約をさせることさえできます。10の強力なユースケース: https://t.co/L5avwoUgl7

OSS音声合成モデル「Dia」続報:感情表現やリアルタイム処理に強み

  • 韓国Nari Labsが開発したオープンソースのテキスト読み上げ(TTS)モデル「Dia」の続報です。
  • 感情表現、叫び声、驚きなどをリアルにシミュレートでき、既存の商用TTSを凌駕する品質と評価されています。
  • 1.6Bパラメータと軽量ながらリアルタイムストリーミングも可能で、多くの開発者が関心を示しています。
Bindu Reddy: (翻訳) Diaはめちゃくちゃ良いオープンソースのテキスト読み上げモデルです。Eleven Labs、OpenAI、その他ほぼすべてのクローズドAIバージョンを打ち負かしています。しかし、まだ誰もホストしていないようです。😭😭 もう1日待って、自分たちでホストします。 https://t.co/0OnTnrUmZi

clem 🤗: (翻訳) 2人チーム = Microsoft、Bytedance、Nvidia、Googleなどを抑えて@huggingfaceでトレンド1位... https://t.co/BZtGDvWnut

Itomaru | いとまる: Dia : A TTS model capable of generating ultra-realistic dialogue in one pass、✍️ https://t.co/cTtd4cxpIr

Gemini月間ユーザー3.5億人と報道【学生無料提供続報】

  • GoogleのAIチャットボットGeminiの月間アクティブユーザー数(MAU)が3.5億人に達したと、米国の裁判資料から明らかになりました。
  • デイリーアクティブユーザー数(DAU)も3500万人と報告されており、急速な成長を示しています(2024年10月時点ではDAU 900万人)。
  • 【続報】既報の米国大学生向けGemini Advanced無料アクセス提供について、期間が2026年春学期末までと更新されました。
TechCrunch: (翻訳) Google Geminiの月間ユーザー数が3.5億人であることが裁判所の審問で明らかに https://t.co/O1T7vOK0t3

Tibor Blaho: (翻訳) 先月時点で、Geminiのデイリーアクティブユーザー数は3500万人、月間アクティブユーザー数は3億5000万人でした。ChatGPTのデイリーアクティブユーザー数は1億6000万人、月間アクティブユーザー数は6億人でした。

Google Gemini App: (翻訳) 米国の大学生の皆さん、2026年春学期末までの無料のGemini Advancedアクセスが待っています → https://t.co/LVVB6Pe8fY (利用規約が適用されます) https://t.co/fcljCwAMNv

OpenAI、2029年収益1250億ドル超予測、新オープンモデル初夏リリースか

  • The Informationによると、OpenAIは2029年に1250億ドル、2030年には1740億ドル超の収益を見込んでいると報じられています。
  • この急成長予測は、AIエージェントや新製品投入によるものと見られています。
  • また、以前報じられたオープンソースモデル計画の続報として、クラス最高性能を目指す新モデルを初夏にリリースする計画も進めていると報じられています。
The Information: (翻訳) OpenAI、エージェントや新製品の普及により2029年の収益が1250億ドル超と予測 OpenAIは、エージェントや新製品に牽引され、2029年に1250億ドル、2030年に1740億ドルを目指す大規模な収益成長を予測しています。🚀 OpenAIの財務の未来: https://t.co/HDieIWaGYC

TechCrunch: (翻訳) OpenAI、次期オープンAIモデルをクラス最高にすることを目指す https://t.co/L2E83tkdxq

Tibor Blaho: (翻訳) リスニングセッションからの新しいOpenAIオープンウェイトモデルに関する詳細情報 - OpenAIの研究担当VPであるAidan Clarkがオープンモデルの開発を主導 - プロジェクトは非常に初期段階にある - 推論モデルである - リリースは初夏に計画されている - それは

Windsurf、価格引き下げで競争激化に対応

  • AIコーディングアシスタント市場で競争が続く中、Windsurfが価格を引き下げたとTechCrunchが報じました
  • これは、先行するCursorなどとの競争激化に対応する動きと見られます
  • 先日報じられたOpenAIによる買収交渉の動きや、GPT-4.1の期間限定無料提供に続く、Windsurfの新たな動きです
  • 開発者にとっては、ツール選択の幅が広がるとともに、価格面でのメリットも期待されます
TechCrunch: (翻訳) Cursorとの競争激化に伴いWindsurfが価格を引き下げ https://t.co/8VyogjYsBx

Ian Nuttall: (翻訳) もしopenaiがwindsurfを買収したら、cursorは最終的に売却に応じなかったことを後悔するのだろうか? https://t.co/vOzmi2MPzf

mizchi: やるか…

Hugging Face、Code Agents構築の新コース公開

  • Hugging Faceは、DeepLearning.AIと協力し、smolagentsフレームワークを用いたCode Agents構築に関する新しいショートコースを公開しました。
  • このコースでは、Hugging Faceの共同創設者兼CSOであるThomas Wolf氏と、AgentsプロジェクトリードのAymeric Roucher氏が講師を務めます。
  • Code Agentsは、ツール呼び出し型エージェントとは異なり、一度に完全なコードスクリプトを生成するアプローチで、開発効率の向上が期待されます。
Andrew Ng: (翻訳) 新しいショートコース:Hugging Face smolagentsを使ったCode Agentsの構築! @huggingfaceとの共同制作で、共同創設者兼CSOの@Thom_Wolf氏と、Hugging FaceのAgentsプロジェクトリードである@AymericRoucher氏が教えるこのコースで、コードエージェントの構築方法を学びましょう。 https://t.co/BnW...

Hugging Face: (翻訳) この新しいコース「smolagentsを使ったCode Agentsの構築」を開始できることを嬉しく思います!Agentsリードの@AymericRoucherが教え、@Thom_WolfがAgentsランドスケープの素晴らしい入門概要を提供します。SmolAgentsの力をマスターする方法を学びに来てください!

NVIDIA、AIエージェント強化用NeMoマイクロサービス提供開始

  • NVIDIAは、AIエージェント開発を強化するための新しいマイクロサービス群「NVIDIA NeMo」の提供開始を発表しました。
  • NeMo Customizer (LLMファインチューニング)、NeMo Evaluator (AIパイプライン/モデル評価)、NeMo Guardrails (安全性確保) が含まれます。
  • これらのマイクロサービスにより、開発者は数回のAPIコールでモデルのカスタマイズ、評価、安全な出力の確保といったデータフライホイールを構築できます。
NVIDIA AI Developer: (翻訳) 🎉 あなたの#aiagentを強化するためのNVIDIA NeMoマイクロサービスが利用可能になったことをお知らせします。🎉 1️⃣ NeMo Customizer: #LLM のファインチューニングを加速・簡素化 2️⃣ NeMo Evaluator: #AI パイプラインとモデルのパフォーマンス評価を簡素化 3️⃣ NeMo Guardrails: シームレスな https://t...

NVIDIA AI Developer: (翻訳) 👀 データフライホイールで#AIagentsを強化する方法を示す新しいNVIDIA NeMoマイクロサービスのデモ: ✅ モデルをカスタマイズ ✅ カスタマイズされたモデルを評価 ✅ 安全で効果的な出力を確保 すべてわずか数回のAPIコールで。今すぐ視聴 ➡️ https://t.co/vRjydTcr3R https://t.co/KCNsVsFOr4

AI Agent開発: 実用化の課題と自律化への道筋

  • AIエージェント開発は急速に進展する一方、実用化に向けた課題も浮き彫りになっています。
  • Anthropicは、来年には自律的なAIエージェントワーカーが登場する可能性があると予測しています。
  • しかし、オンラインショッピングなど特定のタスクでは、ウェブサイト構造の違いなどが原因で期待通りに機能しない課題が指摘されています。
  • こうした課題に対し、強化学習(RL)を用いた訓練手法(RAGEN)や、評価中心(Eval-Centric)アプローチの重要性が議論されています。
久保田 雅也@Coalis: Anthropicが「来年には自律的AIエージェントワーカーが職場に登場する」と予測 今はエージェントの管理と監視のセキュリティ対策ツールに取り組んでいる https://t.co/OLxDuMgDmq

The Information: (翻訳) AIエージェントがショッピングで期待に応えられない理由 AIエージェントは、商品リストやチェックアウトのばらつきによりオンラインショッピングに苦労しており、OpenAIやAmazonが構想するシームレスな購入体験を妨げています。🤔 AIのショッピング課題の詳細: https://t.co/uc7UPXwFG3

Wenhu Chen: (翻訳) ZihanのRAGENに関する研究をチェックしてください。RAGENのコードベースの上に多くの研究が構築されています!素晴らしい仕事です!

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください