2025年06月12日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

OpenAI価格据え置きの中、業界各社が新AI技術・サービスを続々発表

AIの世界は今週も大きな進展がありました。OpenAIのo3モデルは値下げ後も性能維持が確認され、GPT-4.1向けDPO機能も提供開始。GoogleはGemini 2.5 Proの高評価と新動画生成AI「Veo 3 Fast」を発表しました。

NVIDIAは量子計算の実用化見通しや複数の新AIモデルを発表し、Metaは視覚理解の新ワールドモデル「V-JEPA 2」を公開。AppleのAI戦略やAnthropicのClaude Code活用事例も注目を集めています。

それでは各トピックの詳細について見ていきましょう。

目次

  1. OpenAI o3値下げ後も性能維持、GPT-4.1系DPO提供【続報】
  2. Gemini 2.5 Pro評価更新 Veo 3 Fast発表 TPU開発に懸念も
  3. Claude Code続報: 社内活用事例とWebアプリ更新
  4. 【続報】Apple幹部「新Siri準備未完了」と釈明、新UIに賛否
  5. NVIDIA、量子計算実用化や新AIモデル群など多数発表
  6. Meta、視覚理解・予測の新ワールドモデル「V-JEPA 2」発表
  7. Kaggle新コンペ Make Data Count、科学文献のデータ引用特定
  8. AIエージェント実践書籍発売とプロンプト議論進展
  9. AI動向: Diaブラウザ登場、Midjourney提訴、新開発ツール群

OpenAI o3値下げ後も性能維持、GPT-4.1系DPO提供【続報】

  • 先日API価格が大幅に値下げされたOpenAIのo3モデルについて、価格改定後も性能に変更はないとの報告が相次いでいます。OpenAI関係者も性能低下の噂を否定しており、ユーザーは引き続き従来の性能を利用できる見込みです。
  • また、既報のGPT-4.1ファミリー(4.1、4.1-mini、4.1-nano)向けに、DPO(Direct Preference Optimization)を用いたファインチューニング機能の提供が開始されました。これにより、主観的なタスクへのカスタマイズ性が向上します。
Tibor Blaho: (翻訳) 最近のo3の価格引き下げは、OpenAIがモデルをより小さく、蒸留または量子化されたバージョンに置き換えたためだという噂が広まっていますが、複数のOpenAIチームメンバーはすでにこれらの主張を否定しており、まったく同じモデルであり、より効率的なインフラで実行されているだけだと明らかにしています。

OpenAI Developers: (翻訳) GPT-4.1ファミリーをDPO(Direct Preference Optimization)を使用してファインチューニングできるようになりました。🎛️ 固定されたターゲットではなく応答を比較することで4.1、4.1-mini、4.1-nanoをカスタマイズできます。トーン、スタイル、創造性が重要な主観的なタスクに最適です。 https://t.co/NkyjE8zAk5 https...

morgan —: (翻訳) o3の価格引き下げ後、o3-2025-04-16モデルをARC-AGIで再テストし、性能が変化したかどうかを確認しました。再テスト結果と元の結果を比較したところ、性能に違いは見られませんでした。

Gemini 2.5 Pro評価更新 Veo 3 Fast発表 TPU開発に懸念も

  • GoogleのAIモデルGemini 2.5 Proに関する続報です。192kトークン処理やSimpleBenchで引き続き高評価を得ており、特に超ロングコンテキスト処理ではChatGPT o3 Proと比較しても優位性があるとのデータが報告されています。
  • Googleは動画生成AI「Flow」のアップデート版として「Veo 3 Fast」を発表しました。従来と同じ720p解像度で2倍以上高速化されたとのことです。
  • 一方で、GoogleとMediaTekが共同開発するTPU v7eの開発に遅れが生じているとの情報も出ており、今後のAIインフラ戦略への影響が懸念されます。
Philipp Schmid: (翻訳) 新しいGemini 2.5 Pro (06-05) が公開リーダーボードを駆け上がっているのは非常に印象的です!🚀 Live Fictionで192kトークンで最高のモデル、SimpleBenchで62.4%で1位、IDPで最強のドキュメント処理モデル、Aiderで最高のコストパフォーマンス。関係者の皆様、おめでとうございます。https://t.co/XTV4GLOjbh

Google Labs: (翻訳) Flowの改善を続けており、同じ720p解像度で2倍以上高速なVeo 3 Fastをリリースしました。これにより、傑作を作り続けることができます。...なぜかこの2人が引き続き登場していますが(率直に言って、彼らは調子に乗っています)。https://t.co/v1HleJwJ1e

石川陽太 Yota Ishikawa: データ出たようです。やはりo3 pro/o3は、ロングコンテキストで圧倒的な性能を誇っている。ただ超ロングになってくるとGemini 2.5 proに軍配が上がる https://t.co/z3TQSHdvCu

Claude Code続報: 社内活用事例とWebアプリ更新

  • Anthropicのコーディング支援AI「Claude Code」に関する続報です。
  • Anthropicは社内での活用事例を公開し、製品エンジニアリング、マーケティング、法務チームなど幅広い部門での利用状況を明らかにしました。
  • ユーザーの間では、Proプランのレート制限からMaxプランへ移行する動きがある一方、MaxプランのSonnet 4でもレート制限に達する可能性が報告されており、プラン選択の重要性が増しています。
  • さらに、ClaudeのWebアプリケーションが更新され、プロジェクト削除機能やプロンプト改善機能が追加される見込みです。
Anthropic: (翻訳) AnthropicチームがClaude Codeをどのように使用しているかをご紹介します。

ぬこぬこ: クロードマックスゥ!!!使い倒す https://t.co/lOsNHjrcpi

Tibor Blaho: (翻訳) 新しいClaudeウェブアプリのアップデートで、プロジェクトを削除するオプションとプロンプトを改善するオプション(開発者コンソールのプロンプト改善機能に似ている可能性が高い)が追加されます。どちらも現在は非表示です。https://t.co/eyoUfVA8ci

【続報】Apple幹部「新Siri準備未完了」と釈明、新UIに賛否

  • WWDC25で発表されたApple Intelligenceへの評価に関する続報です。
  • Apple幹部は批判が続くSiriの機能進化について、新AI搭載Siriは「デモウェア」ではなく単に出荷準備が整っていなかっただけだと釈明しています。
  • また、iOSなどの新しいUIデザイン「Liquid Glass」については視認性を巡ってユーザーから賛否両論の声が上がっています。
  • 一方で、App StoreではAIを活用したアプリのタグ付け機能を導入し、ユーザーがアプリを発見しやすくする改善も進められています。
TechCrunch: (翻訳) AIチャットボットがますます普及する中、AppleのSiriは依然として取り残されています。ChatGPT、Claudeなどが相次いでアップデートされ、私たちの注目を集める中、Appleのオリジナルアシスタントは#WWDC25後も依然として時代遅れです。「私たちが https://t.co/1R6pmOqxE6

TechCrunch: (翻訳) Appleの幹部は、新しいAI搭載Siriは「デモウェア」ではなく、単に出荷準備ができていなかっただけだと語る | TechCrunch https://t.co/gkmUatGMuv

Kenn Ejima: Appleの新しいデザインLiquid Glassが見づらいと批判されてるけど、iOS 7のフラットデザインが出たばかりの頃だってボロボロだったんよ。 ジョブズが他界してすぐだったから自分もめっちゃ批判してた。 そこから改良に改良を重ねて今がある。デザインってそういうもの。 https://t.co/zUm5OxPdJK https://t.co/Xs6rOAFYUL

NVIDIA、量子計算実用化や新AIモデル群など多数発表

  • NVIDIAのJensen Huang CEOが、量子コンピュータが転換期を迎え、数年以内に実用的な問題解決に貢献するとの見通しを表明
  • エンタープライズAIエージェント向け「MistralAI Nemotronモデル」を発表
  • 物理ベースAIシステム向け合成データ生成モデル「Cosmos Predict-2」を発表
  • 最適化ライブラリ「cuOpt」をオープンソース化
  • AIエージェント構築用リファレンス実装「AI-Q Blueprint」を発表
  • これらの発表は、NVIDIAがAI分野でのリーダーシップをソフトウェアやエコシステム構築にも拡大する戦略を示す
Bloomberg: (翻訳) NvidiaのCEOであるジェンスン・フアン氏は水曜日、量子コンピューティングは転換点に達しており、今後数年間で世界的に「いくつかの興味深い問題を解決する」のに十分なほど強力になるだろうと述べた。https://t.co/zHNIh3eAmr

NVIDIA AI Developer: (翻訳) @MistralAI Nemotronをご紹介します。Nemotronモデルファミリーの最新版です。🎯エンタープライズAIエージェント向けの 高精度+計算効率。📊ツール呼び出し、コーディング、指示追従に優れています。今すぐ試す➡️ https://t.co/jkThcKeeFD テクニカルブログ➡️ https://t.co/D86WviMIKr https://t.co/YllTnr...

NVIDIA AI Developer: (翻訳) NVIDIA cuOpt が #opensource になりました🎉 #GPUパワーでLP、MIP、VRPを高速化—最小限のコード変更で済みます。数分で開始でき、最も複雑な最適化ワークロードでもほぼリアルタイムのパフォーマンスを実現します。📖 https://t.co/sN9o5mmgfG #GTCParis #VivaTech https://t.co/4T1eUxy8n7

Meta、視覚理解・予測の新ワールドモデル「V-JEPA 2」発表

  • Metaが、視覚的な理解と予測において最先端の性能を持つ新しいワールドモデル「V-JEPA 2」を発表しました。このモデルは12億パラメータを持ち、新しい動的な環境に適応し、効率的に新しいスキルを学習するAIの実現を目指すものです。
  • Yann LeCun氏もこの発表に言及しており、MetaのAI研究における重要な進展として注目されています。
  • ワールドモデルは、AIが周囲の環境を理解し、将来を予測する能力を持つための基盤技術であり、より自律的で汎用的なAIエージェントの開発に繋がると期待されています。
Yann LeCun: V-JEPA-v2

TechCrunch: (翻訳) MetaのV-JEPA 2モデルはAIに周囲を理解することを教える | TechCrunch https://t.co/3cmBKSbQsz

morgan —: (翻訳) ヤンが戻ってきた

Kaggle新コンペ Make Data Count、科学文献のデータ引用特定

  • Kaggleで新しいコンペティション「Make Data Count - Finding Data References」が開始されました。
  • このコンペは、科学文献中でのデータセットの引用を特定し、それが一次データなのか二次データ(引用されたデータ)なのかを分類するタスクです。
  • 賞金総額は10万ドルで、エントリー締め切りは2025年9月2日(日本時間9月3日)となっています。
  • データ引用の正確な把握は科学研究の再現性や透明性向上に繋がるため、学術分野におけるAI活用の一例として注目されます。
Kaggle: (翻訳) 📣 コンペティション開始アラート! @makedatacount 主催「Make Data Count - Finding Data References」 🎯 科学文献からデータ引用を特定しタグ付け 💰 賞金総額10万ドル ⏰ エントリー締切:2025年9月2日 https://t.co/L07n7s5K4e

Kagoole: (翻訳) 新しい#kaggleコンペティション「Make Data Count - Finding Data References」が開始されました。メダル:あり カーネルのみ:あり 締切:2025-09-09 23:59:00+00:00 https://t.co/BOiksJqEbf

Takami Sato: Kaggle新コンペ 論文内で使われているデータセットを特定し、それがその論文独自の一次データなのか、引用された二次データなのかを分類するコンペ https://t.co/7bFEfkqVWo

AIエージェント実践書籍発売とプロンプト議論進展

  • AIエージェント開発に関する書籍「現場で活用するためのAIエージェント実践入門」が7月17日に発売されることが発表され、多くの開発者から注目を集めています。AIエージェントの基礎から実装、評価、現場活用までを網羅する内容とのことです。
  • また、LayerXの福島良典氏は「プロンプトエンジニアリング不要論」に対し、メタプロンプトやAgentic RAG、自己改善メモリ、外部ツール連携など、依然として高度な指示や設計が重要であると指摘し、議論を呼んでいます。
  • Andrew Ng氏もGenAIアプリケーションのためのワークフローオーケストレーションに関する新しいコースを紹介しており、AI開発手法の進化が続いています。
s-miyawaki | Algomatic: 拡散と購入希望🙏 7月17日に #AIエージェント現場実践本 を出版します🔥 ✔️エージェントの解釈が一人歩きしてるので整理したい ✔️基礎から実装、現場での活用まで一気に学びたい という方に向け、基礎知識から実装、評価・活用まで https://t.co/bsdIoWG9x3

福島良典 | LayerX: プロンプトエンジニアリングがいらなくなったという風潮がよくわからない。メタプロンプト的な指示の書き方、Agentic RAG的な外部知識の引き出し方、自己改善的なメモリ更新、外部ツールの使い方を適切に教える…etc

Andrew Ng: (翻訳) @astronomerio と提携して作成され、同社のDevRelシニアマネージャーであるKenten Danas氏とデベロッパーアドボケイトであるTamara Fingerlin氏が教える「Orchestrating Workflows for GenAI Applications」で、GenAIパイプラインの構築とデプロイを学びましょう。多くのGenAIアプリケーションには htt...

AI動向: Diaブラウザ登場、Midjourney提訴、新開発ツール群

  • The Browser CompanyがAIファーストを謳う新しいWebブラウザ「Dia」のベータ版をリリースしました。このブラウザはGPT-4.1を利用していると報告されており、AIによる情報整理やタスク実行支援が期待されます。
  • AIによる画像生成サービスMidjourneyに対し、DisneyとUniversalが著作権侵害で提訴したと報じられました。AI生成コンテンツと既存の著作物との関係について、再び法的な議論が活発化する可能性があります。
  • その他、ローカル環境で動作する翻訳ツールPLaMO CLIや、Hugging Faceのモデルやデータセットを検索できるMCPサーバーなど、AI開発を支援する様々なツールが登場しています。
TechCrunch: (翻訳) The Browser CompanyがAIファーストブラウザ「Dia」のベータ版をリリース | TechCrunch https://t.co/QDZrpcXiAB

TestingCatalog News 🗞: (翻訳) Diaブラウザは内部でGPT 4.1を使用しています👀 https://t.co/uDQqJxA7uQ

Bloomberg: (翻訳) ウォルト・ディズニーとコムキャストは、AIスタートアップのMidjourneyを著作権侵害で提訴しました。これは、大手メディア企業と新しい人工知能ビジネス群との間の緊張を示す最新の兆候です。https://t.co/1jPmPPX3KB

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください