2025年05月11日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Google I/O直前、Imagen新版・Veo 3のリーク情報とGrok進化の動き
Google I/Oを直前に控え、Imagen 3.5/4/4 UltraやVeo 3のリーク情報が相次いでいます。高性能な動画生成AIの登場が期待される一方、GrokはX投稿埋め込み機能追加や39万字の入力制限が明らかに。
Gemini 2.5 ProはCanvas機能強化とAPI自動キャッシュ対応、CursorはDevinに迫る背景エージェント機能を実装しました。Llama.cppのVision対応によりオンデバイスAIの可能性も広がっています。
それでは各トピックの詳細を見ていきましょう。
目次
- Google I/O目前 Imagen新版・Veo 3のリーク情報相次ぐ【続報】
- Grok続報: X埋込、39万字制限判明、Musk氏3.5に言及
- Gemini 2.5 Pro、Canvas機能とAPI自動キャッシュで進化
- Cursor v0.5公開、背景エージェント機能追加【続報】
- Google新AI白書、LangChain新UI、ADKハッカソン【続報】
- Llama.cppがVision対応、オンデバイスマルチモーダルへ【続報】
- NotebookLM、書籍学習ガイド機能が好評【続報】
- OpenAI、法人向けクレジット制料金をテストか
- Kaggleコミュニティコンペ盛況、生成AI活用事例も
Google I/O目前 Imagen新版・Veo 3のリーク情報相次ぐ【続報】
- Google I/Oを目前に控え、画像生成AI「Imagen」の次期モデルとされる「Imagen 3.5」「Imagen 4」「Imagen 4 Ultra」や、動画生成AI「Veo 3」に関するリーク情報が複数報じられています。【続報】
- 特に「Veo 3」は、現行の「Veo 2」を大幅に上回る性能を持つと期待されており、AIによるコンテンツ生成のさらなる進化に注目が集まっています。
- これらの新モデルが正式に発表されれば、クリエイティブ分野におけるAIの活用が一段と加速すると見込まれます。
まつにぃ: 画像生成「Imagen 3.5」、動画生成「Veo 3」がI/Oで登場か。 特に動画はNotebooklmの動画機能にも響くと思うのでz、楽しみにせざるを得ませんね (引用ツイート: Imagen 3.5 and Veo 3 coming soon! these might be intended for I/O 👀 https://t.co/KoylJxpp98)
ʟᴇɢɪᴛ: (翻訳) Imagen 4 & 4 Ultraが登場し、3.5は完全にスキップされるかもしれません。3.5は内部使用向けかもしれません。
Chubby♨️: (翻訳) Google I/OでImagen 3.5とVeo 3が登場するかもしれません。もし本当なら、すごいことになりそうです。Veo2は依然として最高のAI動画モデルです。Veo3がどうなるか楽しみです!
Grok続報: X埋込、39万字制限判明、Musk氏3.5に言及
- Grok Webにおいて、X(旧Twitter)の投稿を埋め込む機能が間もなく追加される見込みです。
- また、プロンプトに入力できる文字数制限が39万字であることが明らかになりました。
- さらに、Elon Musk氏は次期モデルGrok 3.5について「(その能力に)懐疑的になるだろう」と述べ、より高度な推論能力を持つ可能性を示唆しました。
Tech Dev Notes: (翻訳) Grok Webは間もなくXの埋め込みを表示開始します!応答内で見栄えが良いです。
Tech Dev Notes: (翻訳) Grok Webのプロンプトには39万文字の制限があります。
Tech Dev Notes: (翻訳) イーロン・マスク氏、Grok 3.5について「懐疑的になるだろう」と発言。
Gemini 2.5 Pro、Canvas機能とAPI自動キャッシュで進化
- GoogleのGemini 2.5 Proに関する続報です。
- 長いコンテキスト処理能力において、Claude Opus 3よりも優れているとの評価が引き続き寄せられています。
- 新たに、Gemini APIの自動キャッシュ機能や、図解作成に便利なCanvas機能のアップデートも注目されています。
- これらの機能強化により、研究や資料作成など、より複雑なタスクへの活用が期待されます。
限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: 科研費報告書作成をGemini2.5Proとo3にやらせてみた結果 ベンチマーク上は長いコンテキストはo3も良いはずなのですがGemini2.5Proの方が圧倒的に良かったです o3の方は文字数をpythonでカウントしていたので文章の内容より文字数に注意が向いていた可能性があります https://t.co/XJhcz3WKmE
限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: 全く同感です! o3は長いコンテキストを含まない単発の質問(特に知識を問うような質問)やWeb検索は優れていると思いますが、長い参考資料を渡して何かしてもらうのはGemini2.5Proが一番優れていると思います (引用ツイート: @genkAIjokyo 最近自分の書いた論文のレビュー頼んでますが、圧倒的に2.5proのほうがスピード、クオリティともに性能いいですね。リバイスで訂正案だす...
Kimihiko Kitase ♨️ 北瀬 公彦: Gemini 2.5 の自動キャッシュ、AI 駆動開発されている方には嬉しいと思うんだけど、あまり注目されてないのでもう一度。 Gemini 2.5 各モデル API 利用で、自動キャッシュが有効になりました!プロンプトの工夫を意識すればコスト削減が見込まると思いますので、ぜひ参考に! 詳細はこちら🔻 https://t.co/2b8cHbTQLd
Cursor v0.5公開、背景エージェント機能追加【続報】
- AIコーディングツールCursorのバージョン0.5がリリースされました。【続報】
- 主な新機能として、バックグラウンドでの複数エージェント実行やフォルダ全体のコンテキスト化が追加されています。
- これにより、Devinのような自律的な開発支援の実現が期待されています。
- 開発者からは、新機能によるコーディング効率の大幅な向上を期待する声が上がっています。
Ian Nuttall: (翻訳) Cursor 0.50が現在展開中で、いくつかの大きな変更があります - バックグラウンドエージェント!プレビュー版ですが、複数のCursorエージェントを同時に実行できます🤯 - コンテキストにフォルダ全体をドロップできるようになりました。これは私が非常に欲しかったものです(有効にしてください)。
石川陽太 Yota Ishikawa: Cursorバージョン0.5のアプデ内容が相当やばいので、アプデ内容を翻訳して共有しときます🫡完全にDevinも食いにきてます… 以下全文 # 簡素化された価格設定・バックグラウンドエージェント・刷新されたインライン編集 統一リクエスト課金、すべてのトップモデルに対応した Max
まつにぃ: CursorやWindsurfもいくつ先はDevinみたいになりそうですね.. (引用ツイート: Background Agent、これはヤバいですね。Claude Code や Devin のような作業の任せ方ができそうですね。 https://t.co/jMlI7IWq6t)
Google新AI白書、LangChain新UI、ADKハッカソン【続報】
- GoogleがAIエージェントに関する白書「Agents Companion」を公開し、評価手法やAgent Opsについて詳述しています。【続報】
- LangChainからはソーシャルメディアエージェントUIのチュートリアルが公開されました。
- Google CloudからはAgent Development Kit Hackathonの開催が告知され、開発環境の整備が進んでいます。
- これらの動きは、AIエージェント開発の本格化とエコシステムの拡大を示しています。
Shinichi Takaŷanagi: GoogleよりAIエージェント白書。評価手法やAgent Opsによる品質・信頼性確保、オンデバイス・クラウド処理の最適バランスやメモリ/状態管理も詳述。自動車AIでの階層・協調・ピア型マルチエージェント連携(ナビ/メディア/メッセージ制御)の実践事例も Agents Companion https://t.co/gBgcLxz0rj
LangChain: (翻訳) 🌐 ソーシャルメディアエージェントUIチュートリアル LangChainのソーシャルメディアエージェントを、複数のコンテンツ投稿方法とNotion統合を備えたユーザーフレンドリーなウェブアプリに変換します。ExpressJSとAgentInbox UIで構築され、シームレスな進捗監視が可能です。ステップバイステップガイドはこちら👉
Google Cloud Tech: (翻訳) 準備を整えましょう—Agent Development Kitハッカソンが5月12日から6月23日まで開催されます! #OpenSource #ADK フレームワークとGoogle Cloudを使用して革新的なマルチエージェントAIシステムを開発し、賞金5万米ドルを競いましょう→ #adkhackathon
Llama.cppがVision対応、オンデバイスマルチモーダルへ【続報】
- オープンソースのLLM実行環境Llama.cppの続報です。
- この度、Llama.cppがVision(画像入力)に対応しました。
- このアップデートにより、ローカル環境やオンデバイスでのマルチモーダルAIアプリケーション開発がさらに容易になることが期待されます。
- コミュニティからは、エッジデバイスでの高度なAI活用が一層進むとの声が上がっています。
Georgi Gerganov: (翻訳) Sonはllama-server実装の維持において素晴らしい仕事をしており、今ではllama.cppに完全なビジョン入力サポートをもたらしています!プロジェクトへの貴重な貢献に多大な称賛と感謝を!
clem 🤗: (翻訳) Llama.cppは@ngxson @ggerganovのおかげでビジョンモデルをサポートするようになりました!オンデバイスマルチモーダル🔥🔥🔥
NotebookLM、書籍学習ガイド機能が好評【続報】
- GoogleのNotebookLMで書籍や資料のPDFをアップロードし、内容理解を助けるクイズ生成機能が注目されています。
- ユーザーからは「精読の代替にはならないが補助ツールとして有効」との評価があります。
- 今後の機能拡充としてAPI提供を望む声も上がっています。
Odashi: これで読書が捗る、と言っている人がいますがそれは読んだ気になるだけじゃないですかね。概要を舐めたり検索したりには非常に役に立ちますが精読の代替にはならないです。 (引用ツイート: NotebookLMにオライリーの本を丸ごとぶち込むと非常に体験がよい。 https://t.co/nNC8egrwoZ)
しば田 | Programming x AI: NotebookLMの「学習ガイド」神機能すぎないか。 押すだけでクイズ10個くらい生成してくれる。 https://t.co/kMtipzCkm9
seya: NotebookLMそこそこの金払うのでAPI作って欲しい - ノートの作成 - リソースの一括アップロード - audio overviewの作成 - audio overviewのダウンロード おなしゃす
OpenAI、法人向けクレジット制料金をテストか
- OpenAIがChatGPTの法人顧客向けに、クレジットベースの新たな料金体系をテストしている可能性が報じられています。
- この新体系では、利用モデルごとに消費クレジットが異なり、ワークスペース単位でクレジットを共有する仕組みと見られています。
- 従量課金制への移行を示唆する動きとして、今後の正式発表が注目されます。
Tibor Blaho: (翻訳) 確認済み - OpenAIはすでにエンタープライズ顧客向けにクレジットに基づいた柔軟なChatGPT価格オプションを提供しています(1メッセージ=モデルに基づいて異なるクレジット数を消費)。ヒントと詳細情報を提供してくれた匿名の方、ありがとう!
Tibor Blaho: (翻訳) 興味深いことに、これらのChatGPTエンタープライズ契約では、プレミアムモデルに対してのみクレジットが必要で、特定のモデルへの無制限アクセスを提供しています。クレジットはワークスペースレベルでプールされ、管理者は特定のグループがどのモデルにアクセスできるかを設定できます。
Kol Tregaskes: (翻訳) 従量課金は避けられないようです。OpenAIはこれをテストしている可能性があります。
Kaggleコミュニティコンペ盛況、生成AI活用事例も
- Kaggleコミュニティ主催のコンペティションが盛況のうちに終了し、参加者からは様々なアプローチが共有されました。
- 中には、学習データを開かずにQwen2.5 VL 72Bを用いたzero-shot推論で上位入賞するチームもあり、生成AIの活用事例として注目されます。
- 多様な手法が試されるKaggleコンペは、AI技術の進展と実践的な知見共有の場として引き続き重要です。
chumajin: コミュニティコンペ3位入賞でした! 久しぶりに嬉しい。 https://t.co/hiZ0OHkroC (引用ツイート: Kaggleで出会ったひとたちと 俺たちのGWは終わらない....!! https://t.co/eqFPhxEldf)
Rabotni(kuma|熊): このコンペではチーム名の「生成AI活用ガチ勢」の名前の通り、学習はおろかtrain.csvすら開かずに、Qwen2.5 VL 72Bでzero-shot推論をして4位になりました! (引用ツイート: コミュニティコンペ3位入賞でした! 久しぶりに嬉しい。 https://t.co/hiZ0OHkroC)
すぐーさん(ID:sugupoko): アプローチ含めてまじで勉強になった! 5位までいろいろアプローチ違っておもろかった (引用ツイート: 優勝しましたー 💪メダルです。 優勝するの初めてでめっちゃ嬉しい!! https://t.co/0omL9Ih40E)