2025年05月05日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Grok 3.5ベータ版から多数のAIツールアップデートまで
xAIの次期モデル「Grok 3.5」ベータ版のリーク情報が注目を集めています。ベンチマーク結果では既存モデルを上回るスコアが示されていますが、公式発表はまだありません。
他にも、AIコード生成能力の強化学習による進化、MCPプロトコルのStripe連携によるマネタイズ対応、ClaudeのWeb検索対応音声機能など、多くのアップデートが報告されています。
医療教育へのAI導入も進み、マウントサイナイ医科大学がChatGPT Eduを全学生に提供開始しました。
それでは各トピックの詳細について見ていきましょう。
目次
- Grok 3.5ベータ版リークか 高性能示すベンチマークも【続報】
- AIコード生成能力、強化学習で新たな段階へ
- MCP続報: Stripe連携でマネタイズ対応、多様なサーバー実装も
- Geminiアップデート: 引用修正、コードコメント指摘、他
- LangChain/LangGraph活用事例続報: 検索拡張や調査アプリ等
- Claude Voice続報: Web検索等対応も会話割込不可
- AI AgentのWebアクセス増、ネット全体でトラフィック急増の懸念
- Nvidia、中国向け新AIチップ設計報道 規制回避狙いか【続報】
- Kaggle IMC 2025 関連ツール公開【続報】
- Cline v3.14公開 LaTeX対応やルール作成機能を追加
- ChatGPT Edu、マウントサイナイ医科大学で提供開始
- AIエージェントに関する学術的研究が進展 (プロトコル, 失敗分類学など)
Grok 3.5ベータ版リークか 高性能示すベンチマークも【続報】
- xAIの次期モデル「Grok 3.5」のベータ版がSuperGrokユーザー向けに展開開始されたとのリーク情報が流れました。【続報】
- 同時にリークされたベンチマーク結果では、MMLUなどで既存モデルを上回るスコアが示唆されていますが、画像の信憑性には疑問の声も上がっています。
- Elon Musk氏もこのベンチマーク結果に言及する投稿をリツイートしており、注目が集まっていますが、xAIからの正式発表はまだありません。
まつにぃ: Grok3.5ベータがSuperGrok向けに順次展開中とのリークが。 推論能力が大幅強化され、特に電気化学やロケット工学など高度技術系の質問に強く、o3とは違いWeb検索依存を低減した「一から考える」Reasoning方式が特徴です。 このモデル次第で、xAIが一気にTop Tierに輝くかもしれません。
Chubby♨️: (翻訳) なんてこった、Grok-3.5はヤバい! このベンチマークは狂ってる。本当ならすごい。
Nathan Lambert: (翻訳) simpleQAがここで最も印象的な数字だ。一般ユーザーにとってはるかに有用な評価。次にMMMU。推論評価はすべてAIオタク向けだ。
AIコード生成能力、強化学習で新たな段階へ
- AIモデルのコーディング能力が急速に進歩、Codeforces等のベンチマークで示される
- プログラミング作業の多くがAI生成コードの修正になる可能性も指摘
- 強化学習によりゼロからコードを書く能力を獲得、教師データ不要の可能性も示唆
Kol Tregaskes: (翻訳) GPTとoシリーズのコーディングスキルは加速しています。
Kenn Ejima: まだ勘違いしている人がいるので定期的に言います。 現世代の生成AIが書くコードが物足りないのは、Githubなど学習したソースの質に依存するから「ではない」です。 強化学習でゼロからコードを書く能力を習得・人間超えできるので、むしろ汎化性能についてはGithubや教師が不要になる方向です。
Kimihiko Kitase ♨️ 北瀬 公彦: そんなに!? 「現在のプログラミングは、コードの8~9割をまずAIに書かせて、それを人間のプログラマーが修正して最終形にしているのですが、これはつまり、現時点ですでに“ゲームの8~9割はAIが作っている”ということになります。」 https://t.co/OznCMjyJBJ
MCP続報: Stripe連携でマネタイズ対応、多様なサーバー実装も
- AIエージェント連携プロトコル「MCP (Model Context Protocol)」への関心が引き続き高まっています。
- GradioやmyCobotと連携するMCPサーバーの実装例が共有されているほか、FastMcpを用いたサーバー構築チュートリアルも登場しています。
- Stripeとの連携により、開発したMCPを数行のコードでマネタイズできる機能も提供され、エコシステムの拡大が期待されます。
Kazunori Sato: 1か月くらい前に、今後WebサービスはUIの代わりにエージェントのためのAPIを公開していくんだろうな、って皆さんと議論してたけど、あっという間に急激に世界がMCP化していっててお父さんもう着いていけない。
しば田 | Programming x AI: 作ったMCPをマネタイズできるようになりましたよと。 Stripeのスピード感すごいな...
Ian Nuttall: (翻訳) 24時間で1000人の新しいフォロワー。人々はビジネスモデルとしてのMCPに興味があるのかな?
Geminiアップデート: 引用修正、コードコメント指摘、他
- Gemini Deep ResearchでレポートをGoogleドキュメントにエクスポートした際の引用文献番号の不一致問題が修正されました。
- Geminiが生成するコードコメントについて、以前から冗長性が指摘されていましたが、今回は「生成時の差分説明に過ぎず読解の邪魔になる」という具体的な意見が出ています。【続報】
- 小売大手のBest Buyが今夏、Geminiを活用した仮想アシスタントを導入予定です。
- Firebase Studioでは、デフォルトの生成モデルがGemini 2.5 ProではなくFlashに設定されていることが報告されています。
限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: Gemini Deep ResearchでGoogleドキュメントにエクスポートすると引用文献バラバラになる問題、解決されてそうです‼️ これは実用性高いですね🤓
mizchi: Gemini の書くコード上のコメント、生成したこの瞬間の差分の説明でしかないことが多く、後で読む時に役に立たないし邪魔
Google Cloud: (翻訳) 小売・消費財業界はAIをどのように活用しているのでしょうか? @BestBuy はGeminiを使用して、この夏、#生成AI を活用した仮想アシスタントを立ち上げます。製品の問題のトラブルシューティング、注文配送の再スケジュール、Geek Squadサブスクリプションの管理などが可能です↓
LangChain/LangGraph活用事例続報: 検索拡張や調査アプリ等
- LangChainおよびLangGraphを活用したAIアプリケーションやツールの開発事例に関する続報です。
- ドキュメント検索Chrome拡張「ChaiGenie」、ワンクリック調査アプリ「Research Agent」、Perplexity風インターフェースの「Curiosity」、動画要約アプリ、会議準備エージェントなどが新たに公開されています。
- MCPサーバー構築チュートリアルや、電子回路設計を応用してLLMの信頼性を高める「AI Decision Circuits」といった技術的な取り組みも紹介されています。
LangChain: (翻訳) 📚🤖 ChaiGenie LangChainのGeminiとQdrant統合で構築されたChrome拡張機能。多言語サポートとベクトルベースの検索でドキュメント検索を強化します。 GitHubでプロジェクトをチェックしてください。
LangChain: (翻訳) 📅🤖 会議準備エージェント 出席者や企業を自動的に調査し、最新のReact/FastAPIインターフェースを通じて会議の洞察を提供するスマートカレンダーアシスタント。高度なエージェントワークフローとライブ推論のためにLangGraphで構築されています。 ここでチェックしてください 🔍
LangChain: (翻訳) 🔌📊 MCPサーバーチュートリアル FastMcpとLangChainを使用して株式市場データを処理するMCPサーバーを構築する方法を学びます。この包括的なガイドでは、標準化されたデータアクセスのためにLangGraphを使用してReActエージェントを作成する方法を示します。 📺 チュートリアルをチェックしてください:
Claude Voice続報: Web検索等対応も会話割込不可
- AnthropicのClaudeモバイルアプリでテスト中の音声対話モード「Claude Voice」に関する続報です。
- 新たにWeb検索やファイルアップロードに対応したことが明らかになりました。
- テキストの自動スクロールUIも搭載されていますが、現在のところ会話への割り込みはできず、手動でタップして話すターンを切り替える必要があるようです。
- 音声は既報の通り4種類(Buttery, Airy, Mellow, Glassy)が用意されていますが、英語のみ対応です。
- 声質については「まあまあ」「退屈」といった評価も見られます。一般公開時期は未定です。
Tech Dev Notes: (翻訳) Claude VoiceはWeb検索、ファイルアップロードをサポートしていますが、GrokやChatGPTの音声のように割り込みはできません。話す順番を変えるには手動で画面をタップする必要があります。
Tech Dev Notes: (翻訳) Claudeの声は4種類あります:Buttery、Airy、Mellow、Glassy。音質はまあまあですが、英語しか話せず、トーンを変えることもできず、割り込みもできません。
まつにぃ: Claudeモバイルアプリに「Voice Mode」がテスト段階に入り、Airy/Mellow/Butteryの3音声が出ています。 Web検索・ファイル添付にも対応し、Push‑to‑Talkとテキスト自動スクロールUIを搭載とか。 只今試験版で一般公開は未定だが早ければ今月中という事でBedrockにも来そうですね!
AI AgentのWebアクセス増、ネット全体でトラフィック急増の懸念
- AIエージェントによる情報収集のためのWebアクセスが、インターネット全体のトラフィックを急増させている可能性が指摘されています。
- AIは人間より遥かに高速かつ大量にWebサイトへアクセスするため、検索数やページビューが桁違いに増加する懸念があります。
- 過去にはWikipediaでAIによるトラフィックが50%増加した事例もあり、Webサイト運営者やインフラ事業者への影響が注目されます。
Kenn Ejima: AIが検索を代行する時代になってすでに起きつつある変化 トラフィックは激増 AIエージェントの基本ツールは検索。AIの情報消費スピードは桁違い。o3は2~3秒で5~20サイトを並行して読み込むサイクルをぐるぐる回す。結果としてインターネットを駆け巡る検索とページビュー数は急増中。
mizchi: トップのキャッチ画像意味無くなってる
Nvidia、中国向け新AIチップ設計報道 規制回避狙いか【続報】
- Nvidiaが米国の輸出規制を回避するため、中国市場向けの新たなAIチップ設計に取り組んでいると報じられました。これはH20チップが規制対象となったことを受けた動きと見られます。【続報】
- CEOのJensen Huang氏が最近北京を訪問し、顧客にこの新設計について説明したとのことです。
- 一方で、規制対象となったH20チップの性能問題や、ASIC開発の難しさも指摘されており、新チップの実現性や性能は不透明です。
- Anthropicが米国の規制強化を支持し、Nvidiaが反論するなど、規制を巡る動きも続いています。
The Information: (翻訳) NvidiaのCEO、ジェンスン・フアン氏が最近北京を訪問し、米国の輸出規制を回避するための中国専用の新しいAIチップ設計について顧客に説明しました。チップ大手にとって重要な市場です。
パウロ: Nvidia 中国向けチップの開発に再度着手 これは厳しい https://t.co/rLULNifEAr
パウロ: NvidiaがAI ASICを中国専用に出すというのも考えにくい 今の余りある演算器を使った柔軟性のあるWARP + Tensor Core の構造だからCudaの優位性がある AI ASICのように特化した演算器のみだとCudaとの繋ぎ込みを開発しないといけない、それは数年かかる
Kaggle IMC 2025 関連ツール公開【続報】
- 開催中のKaggle画像マッチングコンペ「Image Matching Challenge 2025」に関連するツールが公開されました。
- カメラポーズや深度マップを推定するVGGTモデルの推論スクリプトと、Rerunによる可視化ツールが含まれます。
- コンペ参加者にとって有用なリソースとなりそうです。
ぐちやま: IMCやっと始まった! もうしくじりはなしです https://t.co/oCKEArFczS
ころんびあ: (翻訳) #IMC2025 コンペティション向けに、簡単なVGGT推論スクリプト(https://t.co/KjUKhk5Flf)とRerunによる可視化をリリースしました。カメラポーズ、深度マップなどを素早く推定します。
ぐちやま: 金メダル欲しいィ(切実) https://t.co/FXEdDnZyCu
Cline v3.14公開 LaTeX対応やルール作成機能を追加
- AIコーディング支援ツール「Cline」がv3.14をリリースし、複数の新機能を追加しました。
- LaTeXのレンダリングに完全対応し、複雑な数式や科学文書をチャットインターフェースで直接扱えるようになりました。
- OSのファイルエクスプローラーから直接ファイルをドラッグ&ドロップ(Shiftキー併用)で追加可能になり、コンテキスト入力がよりスムーズになりました。
- プロジェクトのデザインシステムやコーディング規約などを文書化する「/newrule」コマンドや、タスク実行中のチェックポイント追加による計画修正機能も搭載されています。
Cline: (翻訳) Clineは数学にも? v3.14リリースに合わせて、Clineは完全なLaTeXレンダリングサポートを含むようになりました。複雑な方程式や科学文書をチャットインターフェースで直接扱えます。
Cline: (翻訳) デザインシステムやコーディング規約のようなプロジェクト標準を強制する必要がありますか? v3.14の新しい/newruleコマンドでClineに文書化を依頼してください!例:「/newrule create design system guidelines」。Clineはプロジェクトを分析し、一貫性のためのルールを生成します。
Cline: (翻訳) 「Act」を押した後、Clineが大量のコードを書く前に計画を微調整したいと思ったことはありませんか? これで可能になりました! Cline v3.14では、PlanモードからActモードに切り替える際の重要なものを含む、タスクワークフロー全体にさらに多くのチェックポイントが追加されました。簡単に元に戻し、計画を洗練させ、再試行できます。
ChatGPT Edu、マウントサイナイ医科大学で提供開始
- OpenAIの教育機関向けプラン「ChatGPT Edu」が、米国のマウントサイナイ医科大学(Icahn School of Medicine at Mount Sinai)の全ての医学生および大学院生に提供されることになりました。
- これは、医療教育分野における生成AI活用の本格的な導入事例として注目されます。
- 教育現場でのAI利用が今後どのように進展していくか、その効果や課題に関心が集まります。
Greg Brockman: (翻訳) ChatGPT Eduが@IcahnMountSinaiのすべての医学生および大学院生に利用可能になりました。
AIエージェントに関する学術的研究が進展 (プロトコル, 失敗分類学など)
- AIエージェントに関する学術的な研究や議論が活発化しています。
- AIエージェント間の連携を標準化するためのプロトコルに関するサーベイ論文が公開され、プロトコルの分類や開発経緯が整理されています。
- また、MicrosoftからはAIエージェントシステムにおける失敗モードの分類学が発表され、既存リスクの増幅やエージェント特有の新たなセキュリティ・安全性問題とその対策が議論されています。
- 脳に着想を得た知能や自己進化型システムなど、より高度なエージェントの実現に向けた研究動向も報告されています。
Itomaru | いとまる: AIエージェント評価指標のまとめ 📝 https://t.co/vN5OK9VIcS
Shinichi Takaŷanagi: AIエージェント"プロトコル”のサーベイ。コンテキスト/エージェント間×汎用/特化でのプロトコル分類学(左図引用)や、開発時系列(右図引用)もある。そもそもA2A以外のAIエージェント間プロトコルの存在を知らなかったので勉強になった… A Survey of AI Agent Protocols https://t.co/N0ai6Ufckc https://t.co/gGgNpSeJr9
Shinichi Takaŷanagi: MicrosoftよりAIエージェントの”失敗”の分類学。既存リスクの増幅のみならず、AIエージェントならでは新規セキュリティ・安全性の問題(偽/悪性エージェント注入、のっとり、RAI、差配のバイアス)とその対策を整理。 Taxonomy of Failure Mode in Agentic AI Systems https://t.co/dvlRAVD0p9