2025年05月04日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Gemini 2.5 Proがポケモン殿堂入り達成、X社の推薦アルゴリズム刷新へ

Gemini 2.5 Proがついにポケモンリーグを制覇し殿堂入りを果たすという注目のマイルストーンが達成されました。

一方、X社(旧Twitter)では軽量版Grokを推薦アルゴリズムに導入することが発表され、Musk氏は推薦品質の大幅向上を約束しています。

OpenAIではオープンウェイトモデルの今夏提供がCEO Altman氏から示唆され、「並外れたもの」が期待されています。様々な機能の実装にも注目が集まっています。

それでは各トピックの詳細について見ていきましょう。

目次

  1. Gemini 2.5 Pro ポケモン攻略 ついに殿堂入り【続報】
  2. X、推薦アルゴリズムに軽量版Grok導入を発表【続報】
  3. OpenAI オープンウェイトモデル今夏提供か CEO発言や期待機能【続報】
  4. Gemini Advanced、カスタムGemsで2.5 Pro選択可に
  5. OpenAI o3、プロンプト追従能力低下の指摘再び【続報】
  6. AIコーディングAgentはプログラミングのルンバか 開発者の役割巡り議論
  7. LangGraph活用事例続報 Web検索Botや経費追跡等
  8. MCP続報: Cline BedrockサポートやDeepwikiサーバー登場

Gemini 2.5 Pro ポケモン攻略 ついに殿堂入り【続報】

  • 以前よりお伝えしていたGemini 2.5 Proによる「ポケットモンスター ブルー」攻略プロジェクトの続報です。
  • 8つのジムバッジ獲得後、ついにポケモンリーグを制覇し殿堂入りを果たしました。
  • ライブストリームで公開されたプレイでは、高度な戦略を実行していた可能性も指摘されています。
  • AIのゲーム攻略能力を示す新たなマイルストーンとして注目されています。
シェイン・グウ: Gemini 2.5 Pro、初AIポケモン殿堂入り https://t.co/TVLc2o7bxl

まつにぃ: おおお! もうGemini2.5 Proがポケモンリーグまでクリアし殿堂入り!! 今後は最早ポケモンベンチはGemini2.5 Proレベルになって、これをクリアしないとGeminiに勝ててないみたいな指標になりそうです。 素晴らしい!

Philipp Schmid: (翻訳) Gemini 2.5 PROが初のAIポケモンチャンピオンになりました!🏅 ポケモンブルーをクリアし、8つのバッジをすべて集め、ポケモンリーグのトップ4を倒しました。🚀

X、推薦アルゴリズムに軽量版Grok導入を発表【続報】

  • 既報の通り、Elon Musk氏がX (旧Twitter) の推薦アルゴリズム改善を予告していましたが、今回、軽量版Grokへの移行が正式に発表されました。【続報】
  • Musk氏はこれにより推薦の質が大幅に向上すると述べており、既に一部改善が見られるとのことです。
  • 今後はAI駆動の広告最適化なども進められる見込みです。
まつにぃ: 本日Xのアルゴリズムが軽量版Grokへ全面移行とイーロンが宣言。 完全AI化でエンゲージメントファームや成りすましを自動検知・抑制していきます。 段階的に導入しており、既に一部機能には反映済。 今後はAI駆動広告最適化やマルチモーダル対応もしていくそうで大きく変わりますね。

Bindu Reddy: (翻訳) すごい!全能のレコメンダーAIが軽量版Grokに置き換えられます。すべてが劇的に変わるでしょう。軽量版LLMは簡単にスパムされる可能性があります🫣

Tech Dev Notes: (翻訳) おはようございます。Grok 3.5が登場する前の最後の週末です。

OpenAI オープンウェイトモデル今夏提供か CEO発言や期待機能【続報】

  • 以前よりお伝えしているOpenAIのオープンウェイトモデル計画に関する続報です。
  • CEOのSam Altman氏が開発者からのフィードバックに基づき「並外れたもの」を今夏にも提供できるだろうと述べたと報じられています。
  • 量子化版、LoRAファインチューニングAPI、商用利用ライセンスといった、開発者が期待する機能が含まれるか注目されます。
まつにぃ: OpenAIは今夏、オープンウェイトの新LLMを提供予定です。 サムアルトマンは「開発者の要望は全部実現可能」と発言しており、量子化バージョン、LoRA微調整API、商用利用OKライセンスなど、開発者が望む機能を揃えて出してくれそうです。 Qwen3超えると熱いですよね。

Bindu Reddy: (翻訳) OpenAIさん、オープンウェイトモデルへの私のリクエストです。 - 32b以下 - ツール使用と指示追従に優れている - 非常に高速 よろしくお願いします😃

Gemini Advanced、カスタムGemsで2.5 Pro選択可に

  • GoogleのGemini Advancedで提供されているカスタム指示機能「Gems」において、Gemini 2.5 Proモデルが明示的に選択・利用可能になったことが報告されています。
  • 以前から内部的に利用されていた可能性も指摘されていましたが、UI上で明確に選択できるようになったことで、より高度なタスクへの活用が期待されます。
  • ただし、純正Gemsでは利用できなくなり、カスタムGemsでの利用が必要との報告もあります。
限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: ちょっと前からGemini Advancedで使えるGemsの出力は2.5Pro選択した状態でGems起動すると2.5Proぽく推論してくれてましたがアップデートで明示的にモデル選択出来るようになってますね Gems起動して左上のタブから通常と同じくモデル選択できます https://t.co/GJRBIrfLvP

限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: 仕事任せるにはやっぱり一番賢いモデルにお願いしたいのでGemsでGemini2.5Proが利用できるようになったのは大きいですね GPTsはモデルがGPT-4oってのがちょっと信頼できない...

限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: GemsをGemini2.5Proで明示して使うやり方、純正のGemsだと気づいたらできなくなってました サイドバーにあるGemsから起動すればできるので純正Gemsを複製して自分で作成したものにすればOKです https://t.co/C1cWhCicZd

OpenAI o3、プロンプト追従能力低下の指摘再び【続報】

  • OpenAIのモデル「o3」について、プロンプトの指示に従う能力が低下しているとの指摘が再び複数のユーザーから上がっています。【続報】
  • 以前から課題として挙げられていたプロンプト追従性の問題が、最近になって目立ってきている可能性があります。
  • 具体的な原因は不明ですが、モデルの挙動が不安定になっている可能性も考えられ、利用者は注意が必要です。
Chubby♨️: (翻訳) どういうわけか、o3のプロンプト追従能力がかなり悪くなった気がする

Kol Tregaskes: (翻訳) OpenAIは何をしているのでしょうか? o3(他のモデルにも影響している可能性あり)は、過去30分(またはそれ以上)で指示を適切に追従したり読み取ったりする能力を失っています。30分前は問題なかった2つのセッションでこれを経験しました。非常に奇妙です。

AIコーディングAgentはプログラミングのルンバか 開発者の役割巡り議論

  • AIコーディングエージェントを「プログラミングのルンバ」と喩えるブログ記事が話題に。掃除そのものではなく、掃除不要な行動を促す点が似ていると指摘。
  • この比喩は、AIエージェントが開発者の視座を高め、より本質的な作業への集中を促すという議論を呼び、共感の声も集まっている。
Kazunori Sato: "こいつはプログラミングのルンバだ。掃除をさせるのではなく、掃除しなくてよくなるような振る舞いを人間に叩き込む機械なのだ" AI Coding Agent を使うことで、怒り狂い、視座が上昇する話 - Lambdaカクテル https://t.co/YUlwkzVBDl

Yuta Kashino: “AI Coding Agentとは…プログラミングのルンバだ。掃除をさせるのではなく、掃除しなくてよくなるような振る舞いを人間に叩き込む機械なのだ“ https://t.co/csL53fitWS プロダクションに関わる職業エンジニアは当然そう思うよね…。少なくと今まで無かった余計な作業が増えたのは事実。

LangGraph活用事例続報 Web検索Botや経費追跡等

  • LangChainのエージェント構築フレームワーク「LangGraph」の活用事例に関する続報です。
  • Azure OpenAIとTavily検索を組み合わせたWeb検索チャットボットや、請求書処理とデータ抽出を行う経費追跡システムなどの事例が公開されています。
  • Trellix社がエンジニアリングアシスタント「Sidekick」の開発にLangGraphを活用した事例も紹介されました。
LangChain: (翻訳) 🤖🔍 スマートWeb検索チャットボット LangGraphとAzure OpenAIを組み合わせ、TavilyによるWeb検索機能を備えたチャットボットを構築します。状態管理と条件付きルーティングを含み、シームレスな検索統合を実現します。 チュートリアルはこちら 👉 https://t.co/CCBrkBuy3D

LangChain: (翻訳) 📊🧾 LangGraph経費追跡 LangGraphを使用して請求書を処理する自動化された経費管理システム。スマートなデータ抽出、PostgreSQLストレージ、および人間による検証機能を備えています。 この実用的なビジネス自動化の例を探る 🔍 https://t.co/x6uRko799K

LangChain: (翻訳) 🛠️ Sidekick: Trellixのエンジニアリングアシスタント TrellixはSidekickを構築し、LangChainの製品スイート(LangChain、LangGraph、LangSmith)を活用してAI搭載の開発アシスタントを作成することで、エンジニアリングワークフローを変革しました。 彼らのストーリーを読む 📖 https://t.co/hdXkS3HdTQ

MCP続報: Cline BedrockサポートやDeepwikiサーバー登場

  • AIエージェント連携プロトコルMCPに関する開発と議論の続報です。
  • 開発ツールClineでAWS Bedrock Application Profileがサポートされ、利用者ごとの料金モニタリングが可能になりました。
  • GitHubリポジトリからドキュメントを自動生成するDeepwikiの情報を取得できる非公式MCPサーバーも登場しています。
  • 一方で、非公式サーバー利用への懸念やOAuth対応などの課題も議論されています。
piqcy: Cline で利用者ごとの利用料金モニタリングを可能にする Amazon Bedrock Application Profile がサポートされました。マージまでにかなり時間がかかり、clicube さんのめげない main への追随により 2 ヵ月をへてのマージです。応援コメントさせて頂いていたので感無量です https://t.co/G7txV1e6hQ

まつにぃ: GitHub リポジトリを解析して自動でwiki形式ドキュメントを生成し、AIアシスタント経由で質問応答や図解まで提供するDeepwiki。 そこで作成した情報に対し、CursorのMCP経由で生成ドキュメントを即読込できるMCPサーバーです。 無料かつAPIキー不要で全ページ取得可能でRAGの可能性広がりますね。

na0: 非公式 MCP servers を何も気にせず、使う(人が量産される)日が来るんだろうか...

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください