2025年07月10日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Grok 4の正式発表とAI人材争奪戦の新展開

xAIが現時点で最も高性能とされる「Grok 4」と「Grok 4 Heavy」を正式発表。ベンチマークで他モデルを大幅に上回る結果を示し、即日APIも公開されました。

一方、MetaがAppleのAI責任者引き抜きに約320億円という異例の報酬を提示したことが報じられ、AI人材獲得競争の激化を示しています。

他にも、YouTubeのAIスロップ対策、OpenAIの新オープンソースモデル情報、東大とPFNのLLM訓練効率化研究など、業界の動きが活発です。

それでは各トピックの詳細を見ていきましょう。

目次

  1. 【続報】xAI、新モデル「Grok 4」を正式発表
  2. Meta、AppleのAI責任者引き抜きに2億ドル超を提示か【続報】
  3. Grok 4、AIコーディングツールCursorで利用可能に【続報】
  4. OpenAIの新オープンソースモデル、H100 GPUが必要か【続報】
  5. Meta、コーディング支援AIをLlamaからClaude Sonnetに変更か
  6. Gemini続報: GemsからCanvasを直接呼び出し可能に
  7. YouTube、AIスロップなど低品質コンテンツの収益化を制限へ
  8. Claude Code Hooks続報: PreToolUseで安全なツール実行
  9. 東大とPFN、LLM訓練効率化に関する研究成果を発表

【続報】xAI、新モデル「Grok 4」を正式発表

  • 先日よりお伝えしていたxAIの次期モデル「Grok 4」および「Grok 4 Heavy」が正式に発表されました。
  • 高難度ベンチマーク「Humanity's Last Exam (HLE)」などでo3やGemini 2.5 Proを大幅に上回るスコアを記録し、現時点で最も高性能なモデルと報告されています。
  • 「Grok 4 Heavy」は複数のエージェントが並列で動作するマルチエージェントシステムを採用しており、APIも即日公開されました。
ChatGPT研究所: AIの限界を試す高難度のベンチマーク「Humanity’s Last Exam (HLE)」はじめ、Grok 4がGemini 2.5 Proやo3のスコアを大きく上回る結果を示す... https://t.co/btDpw8tr4U

Rohan Paul: (翻訳) xAIのGrok 4がHLE(Humanity's Last Exam)で44.4%を達成したとのことです🤯 --- (HLEは、数学、物理学、コンピューターサイエンス、人文科学など100以上の科目にわたる2,500の専門家が作成した質問で構成され、そのうち14%はテキストと画像を組み合わせたものです。著者らは意図的に...)

まつにぃ: Grok4 Heavyはtooluse付きのmulti agent systemっぽく、他モデルのベンチスコアを圧倒的に引き離しているので、これは流石に一回は使うべきか... Cursorに来るの待とうかな。 流石に一度は触っておかないといけない気がします。

Meta、AppleのAI責任者引き抜きに2億ドル超を提示か【続報】

  • 先日お伝えしたMetaによるAppleのAI責任者引き抜きの続報です。
  • 今回、その報酬が2億ドル(約320億円)を超える規模であることが報じられました。
  • この額はAppleのCEOの報酬をも上回る異例の規模であり、トップレベルのAI人材獲得競争の激しさを物語っています。
Mark Gurman: (翻訳) 速報:Metaは「スーパーインテリジェンス」チームの新メンバーに異例の高額報酬を提示しました。その中には、AppleのAIモデル責任者に対する2億ドル以上のパッケージも含まれています。パッケージの実際の構成はこちら — https://t.co/xBfRYu6ZdH

パウロ: ザッカーバーグ AppleのAIチーフを2億ドルで引き抜くことに成功 AppleのCEOは7450万ドルの報酬だった 😂😂😂

久保田 雅也@Coalis: Metaが今度はAppleのファウンデーションモデルチームのヘッドを引き抜いた。数十億円パッケージで AI時代はアクハイアでなくハイアに。法人でなく、一握りの希少な人に価値が紐付くのか。独禁法も回避できるし https://t.co/KU3DWhN54E

Grok 4、AIコーディングツールCursorで利用可能に【続報】

  • xAIの新モデル「Grok 4」が、AIコーディング支援ツール「Cursor」で利用可能になったとの続報です。
  • 多くの開発者が利用するツールへの迅速な統合は、Grok 4の普及を後押しする可能性があります。
  • ただし、一部のユーザーからはCursor上ではGrok 4が本来の性能を発揮できていないとの指摘もあり、今後のチューニングが期待されます。
まつにぃ: CursorにGrok4きてますよー モデル選択欄にひっそりきてました。 Agenticに賢いかお試しです。 https://t.co/YcVYlmboOW

まつにぃ: Grok4の迫真の「Thinking...Thinking...Thinking...」 この子、Cursorとかのtooluseはあんまり上手くないか?? https://t.co/KH4nwPC8ug

Charly Wargnier: (翻訳) CursorでGrok 4を有効にする方法を示す簡単なビデオを作成しました:)

OpenAIの新オープンソースモデル、H100 GPUが必要か【続報】

  • 以前お伝えしたOpenAIの新たなオープンソースモデルに関する続報です。
  • 性能は「o3-mini」に匹敵すると噂されていますが、新たに関係者から動作にはH100 GPUが必要との情報がもたらされました。
  • このことから、比較的小規模なモデルではない可能性が示唆されています。
  • Grok 4の登場で沸く中、OpenAIの次の一手として、オープンソースコミュニティから大きな期待が寄せられています。
Tetsuro Miyatake: OpenAIのオープンソースAIモデルが早ければ来週中にリリースされると思われている。 o3 miniと似たようなモデルになると噂されている。 https://t.co/jEiWrwAUhT

Chubby♨️: (翻訳) OpenAIのオープンソースモデルは来週木曜日! @Yuchenj_UWは、OpenAIのモデルが来週@hyperbolic_labsでホストされることを確認しました。 - それは間違いなくDeepSeek r1を上回るでしょう。そしてそれはo1よりも優れていることを意味します。そうでなければ、最高のオープンソースモデルにはなりません。

まつにぃ: OpenAIのOSSモデルが来週リリースされ、o3-miniやo1以上のモデル性能ではと噂されていますが、やはり気になるのがそのネーミングセンス。 間違っても「o」がめちゃくちゃ付いたり、o1-oss1みたいな多重ナンバリングはやめてほしいですね。

Meta、コーディング支援AIをLlamaからClaude Sonnetに変更か

  • Metaが、社内のAIコーディング支援ツールのデフォルトモデルを、自社開発のLlamaからAnthropicの「Claude 3.5 Sonnet」に変更したと報じられています。
  • 自社モデルではなく競合のモデルを採用するというこの動きは、AI業界に驚きを与えています。
  • 最先端のモデルを利用しないことのリスクを、自社モデルの利用よりも重く見た判断とみられ、実用性を重視する企業のAI戦略として注目されます。
Tetsuro Miyatake: MetaがデフォルトのAIコーディングモデルを自社開発したLlamaからAnthropicのSonnetモデルへと変えたらしい。 これはかなり大きな出来事な気がする。 https://t.co/Q22pN1QuHs

Kenn Ejima: クラウドのLLMに秘匿情報を送るのはセキュリティ的に云々…みたいな立場の人いるよね。 Metaが自社のコーディング支援にガチ競合のAnthropic Claude Sonnetを使ってることについてはどう思うんだろう? Metaの事業のコアのコアだよ。最先端のモデルを使わないリスクの方が大きいってことだよね。

Bindu Reddy: (翻訳) 1兆ドル規模の質問への答えは数時間後に出ます... その質問とは、Grok-4はSonnet-4の信頼できる競争相手か? 明日には決定的な答えが出るでしょう。待ちきれません。

Gemini続報: GemsからCanvasを直接呼び出し可能に

  • GoogleのAIチャット「Gemini」の画像生成・編集機能「Canvas」に関する続報です。
  • カスタム指示機能「Gems」から直接Canvasを呼び出せるようになり、特定のスタイルやフォーマットをGemsに保存しておくことで、インフォグラフィックなどを効率的に生成できます。
  • ユーザーからは「気に入ったビジュアル作成のプロンプトを入れておけるので便利」といった声が上がっており、実用性の向上が期待されます。
限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: GeminiのGemsでもCanvasが使えるように 気に入ったビジュアルやスライド作成のプロンプトを入れておけるので便利になりましたね

Kimihiko Kitase ♨️ 北瀬 公彦: Gems から Canvas を呼べる!?あとで試す。

Kimihiko Kitase ♨️ 北瀬 公彦: Gems から Canvas を呼べる!?インフォグラフィックをテンプレート化できるかな。あとで試す。

YouTube、AIスロップなど低品質コンテンツの収益化を制限へ

  • 以前から問題視されていた「AIスロップ」と呼ばれる低品質なAI生成コンテンツへの対策として、YouTubeが新たな方針を発表しました。
  • 7月15日より、生成AIで大量生産された反復的で独自性に乏しいコンテンツは、収益化が制限される可能性があります。
  • プラットフォームの健全性を維持するための重要な動きであり、今後のAIコンテンツのあり方に影響を与えそうです。
カレーちゃん: YouTubeのコンテンツポリシーがアップデート 7月15日よりYouTube はガイドラインを更新し、大量生産、反復的、独自性に乏しいコンテンツの収益化を制限。低労力で量産された動画やテンプレート使い回し動画は広告収益の対象外になる可能性がある。 現時点で公開されているのは概要。詳細文言は 7 月 https://t.co/b8sN3QLSLb

Rohan Paul: (翻訳) YouTubeはAIで溢れかえっており、今、彼らは対策を講じようとしています。📹 YouTubeは、低品質なAIスロップを抑制するため、大量生産された反復的な動画の広告収益をブロックします。これらは、ストッククリップ、スライドショー、または合成素材を繋ぎ合わせる生成AIツールによって数分で大量生産されます。

Itomaru | いとまる: 公式 : YouTube収益化ポリシーのマイナーアップデート。噂ではなく公式を見れ、📝 https://t.co/KViYWwAKtu https://t.co/i6ui7wOvpF

Claude Code Hooks続報: PreToolUseで安全なツール実行

  • AnthropicのAIコーディング支援ツール「Claude Code」のHooks機能に関する続報です。
  • ツールの実行前に処理を挟める「PreToolUse」フックの活用法が開発者の間で話題になっています。
  • 具体的な活用例として、特定の禁止ワードを含むコマンドの実行を未然に防ぎ、意図しない操作を防止する使い方が紹介されています。
ぬこぬこ: /hooks の PreToolUse の使い道、あんまりイメージ湧いていなかったけど、使ってほしくないコマンドが含まれていた時に実行をとめることもできるの確かに便利 claude codeにNG Word集を設定すればキレなくてすむのでそのやり方|sesere #zenn https://t.co/BlpKaBoqCk https://t.co/8NuDIUwcU3

Ian Nuttall: (翻訳) もしClaude Codeのプランモードでサブエージェントをデプロイするように頼むと、それらが次々とプランを返してきて、どれを受け入れるべきか、あるいは拒否すべきかわからなくなります。非常に混乱します。私は、それらがすべてプライマリプランナーエージェントに報告して、私に1つのプランを提示してくれることを望みます。

西見 公宏 | Generative Agents: Claude Codeに「_v2.pyみたいに、ファイル名でバージョン管理しないで」と言ったら、_new.pyとか_new_v2.pyみたいなファイル名を使ってバージョン管理し始めた。マジでコイツ・・・って思う瞬間。

東大とPFN、LLM訓練効率化に関する研究成果を発表

  • 東京大学の鈴木研究室とPreferred Networks(PFN)が、LLMの訓練効率に関する共同研究の成果を発表し、言語モデルの国際会議「COLM 2025」に採択されました。
  • この研究では、訓練データにその内容を説明するメタデータを付与することで、学習効率がどのように変化するかを調査しました。
  • メタデータの付与は学習効率を改善する一方で、後続タスクによっては性能が低下するトレードオフも存在することを示しており、今後のLLM開発に重要な示唆を与えるものと期待されます。
Daisuke Okanohara / 岡野原 大輔: LLM訓練時にデータを説明するメタデータを挿入することで学習効率が変わるのかを調べた東大鈴木研とPFNの共同研究がCOLM 2025に採択されました。学習効率を改善する利点が大きいが、隠れた情報を推定する能力を学習する機会が失われ、後続タスクの条件次第でトレードオフがあることを示しました

今井翔太 / Shota Imai@えるエル: NVIDIAに関しては、2020年ごろにスケーリング則が見つかって「今後のAIのレースがお金にものを言わせたNVIDIAのGPU獲得競争になる可能性が高い」と、当時の時点でAI研究者の一部は気づいてたはずで(そしてすぐに「基盤モデルの考えも出てきた」)、結構な人数が美味しい思いをしてる気がします

パウロ: 合成データのスケーリングが始まりつつありますね

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください