2026年06月21日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

GPT-5.6の性能向上とオープンソースモデルの躍進

次期モデル「GPT-5.6」によるゲームのワンショット作成や、早期リリースの可能性に注目が集まっています。

また、GLM-5.2などオープンソースモデルが最先端モデルに肉薄し、AI開発の勢力図に変化の兆しが見えます。

その他、視覚的RAG「PixelRAG」の登場など、新たな技術的アプローチも話題です。

それでは、本日の詳細なニュースをチェックしていきましょう。

目次

  1. GLM-5.2等OSSモデルが最先端モデルに肉薄【続報】
  2. GPT-5.6がThe Simsをワンショット作成【続報】
  3. CodexのRecord & Replay活用事例が続々【続報】
  4. Grok WebにWork folder機能追加【続報】
  5. NotebookLMに文献レビュー生成機能が追加予定【続報】
  6. Kaggleポケカコンペ、PCBLが新レギュ対応【続報】
  7. 新AI Agent FW「Leve」公開とHermesの躍進【続報】
  8. HTMLパース不要の視覚的RAG「PixelRAG」が登場
  9. [OpenAI] 京都で総額$1Mのピッチコンテスト開催へ

GLM-5.2等OSSモデルが最先端モデルに肉薄【続報】

  • オープンソースモデルの性能向上に関する続報です。
  • GLM-5.2がOpus 4.8やGPT-5.5に匹敵する性能を示し、多くの開発者から絶賛されています。
  • Kimi 2.7やDeepSeek v4などと組み合わせることで、高価なクローズドモデルへの依存を大幅に減らせると話題です。
  • オープンソースモデルの進化スピードが凄まじく、AI開発の勢力図に変化をもたらしつつあります。
CyrilXBT: (翻訳) GLM-5.2は私がこれまで見た中で最も印象的なオープンモデルであり、他を寄せ付けません。最も難しいエージェントコーディングベンチマークでClaude Opus 4.8に約1%差まで迫り、GPT-5.5のほとんどを上回っています。Opus 4.7には2桁の差をつけています。これは7530億パラメータのMITライセンスモデルです。

Yuchen Jin: (翻訳) GLM-5.2を1日使ってみて、Opus 4.8やGPT-5.5レベルに近いと感じることが多いのに驚いています。Opus 4.8と並べて比較しましたが、GLM-5.2の結果の方が好ましいことすらありました。OSSのLLMは、はるかに少ないGPUでトレーニングされていることを考えると本当に印象的です。

Bindu Reddy: (翻訳) ハハ、これは信じられません!Opus 4.8とGPT 5.6が必要なのはタスクの10〜15%だけで、残りはKimiとGLMで十分だと思います。目の飛び出るようなAnthropicの請求書を支払っている企業は、公式に狂ったように払い過ぎています🤯

GPT-5.6がThe Simsをワンショット作成【続報】

  • OpenAIの次期モデル「GPT-5.6」に関する続報です。
  • GPT-5.6がゲーム「The Sims」をワンショットで作成したという報告があり、大幅な性能向上が期待されています。
  • 一方で、現在テストされているGPT-5.6 Proとみられるモデルについては、抽象タスクでの進化を感じられないという声も上がっています。
  • 予想より早くリリースされる可能性が示唆されており、コミュニティの注目が集まっています。
Chubby♨️: (翻訳) GPT-5.6が本当に楽しみです。ハーネスなしで「The Sims」のシミュレーションをワンショットで作成するなんて狂ってます。

まつにぃ: うーんGPT Proこれ5.6になってるのか、抽象タスクではちょっとすごい進化をまだ感じられていない。 ルーティングされていないのか。 運ゲーか。 ただ思考は長くなってる。 良い意味で。

Haider.: (翻訳) 予想よりも早くGPT-5.6がリリースされそうです... ☹️

CodexのRecord & Replay活用事例が続々【続報】

  • OpenAIのCodexに追加された「Record & Replay」機能に関する続報です。
  • Obsidianと連携させて24時間稼働のパーソナルOSを構築するなど、高度な活用事例が共有され始めています。
  • 経費精算や休暇申請などの定型作業を自動化する強力なツールとして、引き続き注目を集めています。
takuya kikuchi: これは単発の機能なのか、あるいは今後AIが「業務」を覚える入り口になっていくのか 社内の業務を理解したCodexたちで寄り集まって業務の全体最適を導いてくれないものだろうか

CyrilXBT: (翻訳) Obsidian + Claude Code = 24時間365日稼働のパーソナルオペレーティングシステム。あなたが寝ている間も働きます。今夜これを構築した人は、二度と同じようには働かないでしょう。今すぐ見てブックマークしてください。

Vaibhav (VB) Srivastav: (翻訳) 良い仕事のルール:問題を解決する前に、それと向き合う時間をしっかり取ること。Codexを使う場合:定義し、境界を探り、解決策の形をスケッチします。「5分でアプリを作る」世界では、事前の明確さがこれまで以上に重要です。それからエージェントを解き放ちましょう。

Grok WebにWork folder機能追加【続報】

  • xAIのGrokに関する続報です。
  • Web版に新たに「Work folder」機能がリリースされました。
  • 生成されたファイルを、ユーザーが選択したGoogle Driveのフォルダに直接保存できるようになります。
  • 外部ストレージとのシームレスな連携により、実用性がさらに向上しています。
Tech Dev Notes: (翻訳) xAIがGrok WebにWork folder機能をリリースしました。

Tech Dev Notes: (翻訳) Grokは生成されたファイルを、ユーザーが選択したGoogle Driveの任意のワークフォルダに直接保存できるようになりました。

NotebookLMに文献レビュー生成機能が追加予定【続報】

  • GoogleのNotebookLMに関する続報です。
  • ソースに基づいて文献レビューマトリックスを生成する「Lit review」機能が追加される予定です。
  • 複数の文献を横断的に整理・比較する研究者や学生にとって、非常に強力なツールになると期待されています。
  • Google Play BooksやText Booksのソース追加も見据えたアップデートとみられています。
🚨 AI News | TestingCatalog: (翻訳) GoogleはNotebookLM向けに「Lit review」と呼ばれる新しいアーティファクトタイプを開発中です。このモードでは、ソースに基づいて「文献レビューマトリックスを生成」できるようになります。Google Play BooksやText Booksのソース追加が予定されていることを考慮すると、Googleは計画を進めているようです。

Kaggleポケカコンペ、PCBLが新レギュ対応【続報】

  • Kaggleで開催中のポケモンカードゲームAIコンペに関する続報です。
  • ポケモン画像認識エンジン「PCBL」のv0.0.34がリリースされ、レギュレーションM-Bに対応しました。
  • 新たにメガシンカなどの認識が可能になり、参加者のモデル改善に貢献しています。
fufufukakaka: 本当は金曜日にやり切るつもりだったのですが、ちょっと伸びてしまった。今レギュレーションもよろしくお願いします (ポケカコンペと被っていて大変なことになっている)

ころんびあ: ポケカコンペだんだんと熱い試合になるようなAgentが組めてきていいけど1000遠い

charm: ポケカコンペ無限に味する

新AI Agent FW「Leve」公開とHermesの躍進【続報】

  • LangGraph上に構築されたファイルシステムファーストのエージェントフレームワーク「Leve」が新たに公開されました。
  • Nous Researchの「Hermes」に関する続報です。OpenClawを凌ぐ勢いでGitHubコントリビューターを集め、急速に成長しています。
  • 多様なアプローチを持つオープンソースのエージェントフレームワークの開発競争がさらに活発化しています。
Harrison Chase: (翻訳) @jit_infinityからの非常にクールな作品:🔥Leve:LangGraph上に構築されたファイルシステムファーストの耐久性のあるエージェントフレームワーク。エージェントをファイルのディレクトリとして記述します。Leveはそのディレクトリをエージェントにコンパイルして実行します。VercelのEveにインスパイアされています。

The Information: (翻訳) いくつかの模倣品がOpenClawに追いつき始めています。Nous ResearchのエージェントツールであるHermesは、過去30日間の新規GitHubコントリビューター数で最近OpenClawを上回りました。詳細と、これがAIエージェント競争に何を意味するかについて:

HTMLパース不要の視覚的RAG「PixelRAG」が登場

  • UC Berkeleyの研究者が、HTMLパースをスキップしてスクリーンショットを使用するオープンソースシステム「PixelRAG」をリリースしました。
  • Webページをテキストに変換してチャンク化する従来の手法とは異なり、視覚情報を直接処理します。
  • WebスクレイピングとRAGの新しいアプローチとして、開発者の間で大きな注目を集めています。
Charly Wargnier: (翻訳) RAGのためのHTMLパースをやめましょう。スクリーンショットを撮るだけです🔥 UC Berkeleyの研究者が、HTMLパースを完全にスキップするオープンソースシステム「PixelRAG」をリリースしました。なぜこれがWebスクレイピングを永遠に変えるのでしょうか?ページをテキストにスクレイピングしてチャンクを埋め込む代わりに:

[OpenAI] 京都で総額$1Mのピッチコンテスト開催へ

  • OpenAIとOpenNetwork_Labが、京都でスタートアップ向けのピッチコンテストを開催します。
  • 優勝者には10万ドル、プログラム全体で100万ドル規模のOpenAI APIクレジットが提供されます。
  • 日本のスタートアップエコシステムに対するOpenAIの積極的な支援姿勢が伺えます。
Kazuhiro Sera (瀬良): 先日の OpenAI のイベントで概要のみ発表していた OpenAI と Onlab によるピッチコンテストの募集がいよいよ始まりました→ https://t.co/ydxSm6mGV6 OpenAI の API クレジットをかけて 7/1 に京都でピッチしたい方、ぜひご応募ください!🔥

Peter Steinberger 🦞: (翻訳) もしあなたが日本🇯🇵にいるか、そこでビジネスをしているなら、大量のトークンを獲得するチャンスです!

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください