2025年05月24日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
主要AI企業の新機能ラッシュ:基盤モデル更新と専門分野への展開
今週のAI業界では、主要プラットフォームの基盤技術強化と専門分野への展開が進んでいます。
OpenAIはChatGPTのOperator機能をo3モデルに更新し、タスク成功率向上を実現。また、RDKit連携で化学・生物学研究をサポートする新機能も登場しました。
GoogleはGemini 2.5 FlashのTTS機能が高評価を集め、Vertex AIでVeo3などの生成AIツールを提供開始。AnthropicもClaude 4のエコシステム拡大に注力しています。
それでは各トピックの詳細について見ていきましょう。
目次
- ChatGPT Operator機能、o3モデルで強化
- Claude 4続報: iOS新音声やコラボ書籍でエコシステム拡大
- Gemini 2.5 Flash TTS高評価 S.ブリン氏も期待【続報】
- OpenAI、ミュンヘンでAIエージェントチーム構想を発表
- Grok続報: Web版に新機能、モバイル版改善要望も
- Google I/O続報: Veo3等Vertex AIで、Code Assist無料提供
- ChatGPT、RDKit連携で化学・生物学研究を強力支援
- AI推理力測定の新ベンチマークTurnaboutLLM登場
- UI生成AI v0、新モデルv0-1.5発表 APIも近日公開【続報】
ChatGPT Operator機能、o3モデルで強化
- OpenAIは、ChatGPTの「Operator」機能の基盤モデルを最新のo3に更新したと発表しました。
- 共同創業者のSam Altman氏やGreg Brockman氏もこの更新を「大きな改善」と評価しており、タスク成功率の向上や、より明確で構造化された応答が期待されています。
- このアップデートにより、ユーザーはさらに高度なAIアシスタンスを受けられるようになります。
OpenAI: (翻訳) Operator 🤝 OpenAI o3 ChatGPTのOperatorが最新の推論モデルで更新されました。 https://t.co/gGhvuyz5HB
Sam Altman: (翻訳) 大きな改善です! (引用ツイート: 本日、Operatorの基盤モデルをo3に切り替えました。以前の4oベースのモデルから飛躍的に改善したと考えています。以前失敗したプロンプトで試してみてください!これに取り組むのは楽しかったですし、oシリーズのパラダイムはすべてをより良くしてくれます!)
Greg Brockman: (翻訳) Operatorはo3を搭載し、全体的なタスク成功率が向上しました。また、より明確で徹底的、かつ構造化された応答が得られるようになります。 (引用ツイート: Operator 🤝 OpenAI o3 ChatGPTのOperatorが最新の推論モデルで更新されました。 https://t.co/gGhvuyz5HB)
Claude 4続報: iOS新音声やコラボ書籍でエコシステム拡大
- AnthropicのClaude 4シリーズに関するエコシステム拡大の続報です。
- 同社のAlex Albert氏は「Claude 4への需要は24時間で非常に高い」と述べ、特に最先端のスタートアップからの高い評価を示唆しました。
- 具体的な動きとして、iOSアプリへの新しい音声追加や、音楽プロデューサーRick Rubin氏とのコラボ書籍「The Way of Code」の発表など、エコシステムがさらに拡大しています。
Alex Albert: (翻訳) わずか24時間でのClaude 4への需要は本当に驚異的です。特に、最先端のスタートアップがOpusを試して、突然彼らの製品が…機能するようになったという話を聞くのが一番気に入っています。
TestingCatalog News 🗞: (翻訳) Claudeアプリ(iOS)に新しい(5番目の)音声が追加され、Claude 4の紹介バナーも表示されるようになりました。「Rounded」👀 https://t.co/npuSsPFEE5
Tibor Blaho: (翻訳) 素晴らしいプロジェクト - 各ビジュアライゼーションには、Claudeアーティファクトをリミックスするためのリンク、またはソースコードを表示するためのリンクが含まれています(ホバー時に表示) https://t.co/88Y1nZlmkO (引用ツイート: THE WAY OF CODE、@rickrubin と Anthropic の共同プロジェクト: https://t.co/F...
Gemini 2.5 Flash TTS高評価 S.ブリン氏も期待【続報】
- GoogleのGemini 2.5 FlashモデルとそのText-to-Speech(TTS)機能について、新たな高評価が寄せられています。【続報】
- Google共同創業者のSergey Brin氏がLogan Paul氏との対談でGeminiの進捗に期待感を示したほか、Jeff Dean氏も2.5 Flashを「高品質かつ高速」と改めて評価しています。
- 開発者からは、TTS機能を用いたマルチスピーカーポッドキャスト生成など具体的な活用事例が報告されており、その表現力の高さが注目されています。
Logan Kilpatrick: (翻訳) Googleの共同創設者であり、Geminiに取り組んでいるコンピューターサイエンティストであるSergey Brin氏との、Geminiの1年間の進捗に対する反応についての会話 https://t.co/nI1gEO96zH
Jeff Dean: (翻訳) Gemini 2.5 Flashは高品質なモデルであり、そして…電光石火の速さです。複数の意味で速いというのは、最高の速さです。 (引用ツイート: IOでは多くの発表があり、新しい2.5 Flashは見落としがちです。能力と速度の新たな境界を押し広げています! https://t.co/KHdTpeh6T6)
Philipp Schmid: (翻訳) Gemini 2.5 Flashと新しいテキスト読み上げ(TTS)モデルを使用して、エージェントパターンに関する5分30秒のマルチスピーカーポッドキャストを生成しました!I/Oでは、Gemini 2.5 ProおよびFlash向けのネイティブで制御可能な音声生成機能を発表しました。 > 制御可能なスタイル、アクセント、ペース、トーン。 > シングルおよび https://t.co/td...
OpenAI、ミュンヘンでAIエージェントチーム構想を発表
- OpenAIがドイツ・ミュンヘンでのイベントで、AIエージェントの新たな活用構想を発表しました。
- 「AIエージェントチーム」と称されるこの構想では、開発者が主要業務に集中し、他の作業をAIエージェント群に委任する未来が描かれています。
- これは、AGI(汎用人工知能)実現に向けたOpenAIの次の一手と目されており、ソフトウェア開発のあり方を変革する可能性を秘めています。
Tibor Blaho: (翻訳) 「ソフトウェア開発を再考する時が来た」 「開発者がAIでより速く動き、所有したい仕事を推進し、残りをエージェントに委任する未来を想像している」 「次は - 独立した貢献者のチーム」 出典:OpenAIミュンヘンイベント(2025年5月23日) https://t.co/BPy1UEWaA9
Chubby♨️: (翻訳) 正直なところ、OpenAIはAGIスケールの最終段階、つまりAIエージェントのチームが協力関係に入る段階に進んでいるように聞こえます。AGI / WAGMI 2025? https://t.co/zC6UUpjmMJ (引用ツイート: 「ソフトウェア開発を再考する時が来た」 「開発者がAIでより速く動き、所有したい仕事を推進し、残りをエージェントに委任する未来を想像している」 「次は...
Tibor Blaho: (翻訳) https://t.co/AAU3Xgli6U (引用ツイート: OpenAIはドイツ初のオフィスをミュンヘンに開設しました。ドイツはヨーロッパで最もChatGPTユーザーが多く、有料会員数では世界のトップ3市場の1つであり、米国以外ではビジネス顧客にとってトップ3市場であり、最大の https://t.co/6pGwmrLjT4)
Grok続報: Web版に新機能、モバイル版改善要望も
- xAIのAIモデル「Grok」に関する続報です。
- Web版では、最近アクセスしたワークスペースの表示機能や、生成したチャートを画像またはスプレッドシート形式でダウンロードする機能が追加されました。
- 一方で、iOSおよびAndroidのモバイルアプリでは、ログインに関する不具合や特定ページのURL読み込みに関する改善要望がユーザーから寄せられています。
- これらの改善とともに、次期モデル「Grok 3.5」のリリースにも引き続き期待が寄せられています。
Tech Dev Notes: (翻訳) Grok Webで最近アクセスしたワークスペースが表示されるようになりました: https://t.co/bdZMJ8OnnU
Tech Dev Notes: (翻訳) Grok Webでチャートを画像やスプレッドシートとしてダウンロードできるようになりました! https://t.co/hzdsobJjkq
Tech Dev Notes: (翻訳) OpenAI、Google、Anthropicの最近のリリースを踏まえて、Grok 3.5は期待に応えられると思いますか…?
Google I/O続報: Veo3等Vertex AIで、Code Assist無料提供
- Google I/Oで発表されたAI新機能に関する続報です。
- 動画生成AI「Veo 3」、画像生成AI「Imagen 4」、音楽生成AI「Lyria 2」がVertex AIで利用可能になりました。
- また、開発者向けAIコーディングツール「Gemini Code Assist」が無料提供されます。
- これらのアップデートは、クリエイティブ制作や開発効率の向上に貢献すると期待されます。
Google Cloud: (翻訳) #GoogleIO からのGoogle Cloudニュース:Vertex AI向けのVeo 3、Imagen 4、Lyria 2!また、個人向けのGemini Code Assistがすべての開発者に無料で利用可能になりました。さらに、新しいGoogle Cloud + @nvidia コミュニティに参加しましょう。しかし、それだけではありません ↓ https://t.co/H4Gg...
Google AI Developers: (翻訳) 🆕 #GoogleIO からのGemini APIアップデート。改善された2.5 Flashプレビュー、高度なテキスト読み上げ(TTS)、ネイティブオーディオダイアログ、およびデバッグとコンテキストを改善するためのURLコンテキストや思考サマリーなどの新しいツールを使って構築を開始しましょう。https://t.co/hnpYve4hNs
Google Cloud Tech: (翻訳) ビデオとオーディオの出会い。🎥🤝🔊 最新鋭の生成ビデオモデルであるVeo 3を使えば、作成したクリップにサウンドトラックを追加できます。さまざまな映画のようなスタイルでビデオを開発しながら、話すキャラクターを作成したり、効果音を含めたりすることができます。🧵 https://t.co/5Hfpetfg8b
ChatGPT、RDKit連携で化学・生物学研究を強力支援
- ChatGPTが新たに化学情報ライブラリ「RDKit」と連携し、分子構造の分析、操作、可視化が可能になりました。
- OpenAIのGreg Brockman氏が発表したこの機能は、創薬、生物学、化学といった科学研究分野での応用が期待されます。
- 研究開発プロセスの効率化や新たな発見の促進に貢献する可能性があります。
Greg Brockman: (翻訳) ChatGPTはRDKitライブラリを介して分子や化学情報を分析、操作、視覚化できるようになりました。健康、生物学、化学にわたる科学的研究に役立ちます。https://t.co/WfbjuSMFVR
Chubby♨️: (翻訳) 美しい!これらの微妙な違いがChatGPTを競合他社から際立たせています https://t.co/IJLuL84gpj (引用ツイート: ChatGPTはRDKitライブラリを介して分子や化学情報を分析、操作、視覚化できるようになりました。健康、生物学、化学にわたる科学的研究に役立ちます。https://t.co/WfbjuSMFVR)
AI推理力測定の新ベンチマークTurnaboutLLM登場
- AIの論理的推論能力を測る新しいベンチマーク「TurnaboutLLM」が発表されました。
- 人気ゲーム「逆転裁判」や「ダンガンロンパ」の世界観をベースに、AIが矛盾点を見つけ出すタスクを通じて推理力を評価します。
- 最大300通りにもなる証言や証拠の組み合わせがあり、AIの高度な読解力と判断力が試される内容と報告されています。
AIDB: AIがどこまで「推理」できるのかを知るために、あの「逆転裁判」と「ダンガンロンパ」の世界を舞台にしたテストを作り試したとの報告論文。 ゲーム内では、矛盾を見つける課題が与えられます。 選べる証言や証拠の組み合わせは最大300通りにもなり、かなり骨の折れる内容です。 https://t.co/2V7di2VyfK
AIDB: (翻訳) TurnaboutLLM: 探偵ゲームに基づく演繹的推論ベンチマーク https://t.co/szptxxsDF6 Yuan Yuan, Muyu He, Muhammad Adil Shahid, Jiani Huang, Ziyang Li, Li Zhang (ペンシルベニア大学、ドレクセル大学) この論文では、TurnaboutLLMという新しいフレームワークを紹介します。
AIDB: https://t.co/S3ymew4j7f
UI生成AI v0、新モデルv0-1.5発表 APIも近日公開【続報】
- UI生成AI「v0」に関する続報です。Web開発に特化した新モデル「v0-1.5-md」および「v0-1.5-lg」が発表されました。
- これらの新モデルは、デザインからコード生成までのプロセスを効率化し、より迅速なWebアプリケーション開発を支援します。
- 現在は公式サイトで利用可能で、APIも近日公開予定です。
v0: (翻訳) UI生成とWeb開発向けの最新モデル、v0-1.5-mdとv0-1.5-lgを発表します。本日より https://t.co/FYzpT3p4KO で利用可能です。APIは来週公開予定です。https://t.co/pCoMH3hFbo
Tibor Blaho: (翻訳) いいね https://t.co/bO1giwvM2l (引用ツイート: @v0 https://t.co/0Y83uVlY1z)